cuda相关内容

CUDA - 在内核中创建对象并在主机上使用它们

我需要在我的内核中使用多态性。唯一的方法是在设备上创建这些对象(在设备上创建一个虚拟的mehod表)。下面是正在创建的对象 类Production { Vertex * boundVertex; } 类顶点{ 顶点* leftChild; Vertex * rightChild; } 然后在主机上执行: 生产* dProd; cudaMall ..
发布时间:2016-10-20 23:59:00 C/C++开发

CUDA似乎没有编译

我目前在Visual Studio 2012 Express上运行CUDA 5.0工具包。 我试图运行以下代码 我已经在Visual Studio中编译.cu的方法搜索了高和低。 代码我试图编译: //CUDA.cu #include #include #include #inclu ..
发布时间:2016-10-20 23:50:48 C/C++开发

什么是“正确的”方式来实现CUDA的32位memset?

CUDA有API调用 cudaError_t cudaMemset(void * devPtr,int value,size_t count) 用单字节值填充缓冲区。我想用一个多字节值填充它。假设,为了简单起见,我想用一个32位(4字节)的值填充 devPtr ,并假设我们可以忽略字节序。现在,CUDA驱动程序具有以下API调用: CUresult cuMemse ..
发布时间:2016-10-20 23:48:29 C/C++开发

如何在Windows上使用其他具有CUDA的c ++编译器?

我试图用CUDA构建一个简单的应用程序,我一直在尝试几个小时在结束,我只是不能使它在Windows上工作。 nvcc绝对拒绝编译没有Visual Studio的编译器不支持我需要的东西。我试图建立使用nvcc与铛,但它只是要求我使用Visual Studio的编译器。我也试过直接使用clang,因为它现在支持CUDA,但我收到这个错误: clang ++。exe:error:Unsuppo ..
发布时间:2016-10-20 23:42:59 C/C++开发

变化的结果从cuBlas

我实施了以下CUDA代码,但我对该行为有点困惑。 #include #include #include #include #include“cublas_v2.h” #include #include #include ..
发布时间:2016-10-20 23:37:02 C/C++开发

成员“已经被声明为”与CUDA和Eigen的误差

我只是一个CUDA和Nsight的初学者,想利用线性代数运算(例如CUBLAS)伟大的GPU性能。我有很多自定义代码,在 Eigen 的帮助下编写是很多矩阵乘法运算,所以我想让我的代码不变,只是做GPU上的操作。 我已经创建了一个示例项目与Visual Studio Nsight和它工作正常,但当我添加 #include 行,我遇到以 ..
发布时间:2016-10-20 23:17:16 C/C++开发

Cuda零拷贝性能

任何人都有使用零拷贝分析CUDA应用程序的性能的经验(参考这里:默认固定内存VS零复制内存)内存模型? 我有一个内核使用零复制功能和NVVP我看到以下内容: 在平均问题大小上运行内核我获得0.7%的指令重放开销,所以没有什么主要。所有这0.7%是全局内存重放开销。 当我真正解决问题大小时,我得到的指令重放开销为95.7%,所有这些都是由于全局内存重放开销。 然而,正常问题大 ..
发布时间:2016-10-20 23:17:05 C/C++开发

具有多个.h和.cu文件的静态库无法解析函数

当使用multiple.h和.cu文件编译静态库时,我得到一个未解析的extern函数。这是一个复制错误的简短示例。 似乎我无法获得Nsight Eclipse版本编译extrafunctions.cu。在我的完整项目中,首先编译具有额外函数的文件,但仍然会导致无法解析外部函数错误。 此示例: ****项目配置的调试linkerror **** make all 构建 ..

CUDA:2D网格中的线程ID分配

让我们假设我有一个内核调用与2D网格,像这样: dim3 dimGrid(x,y); //不重要什么实际值是 dim3 dimBlock(blockSize,blockSize); myKernel>>(); 现在我已经读过多维网格只是为了简化编程 - 底层硬件只会使用1D线性缓存的内存(除非你使用纹理内存,但这里不相关)。 ..
发布时间:2016-10-20 22:57:03 C/C++开发

从命令行编译CUDA代码

我试图从命令行编译CUDA代码,使用语法: nvcc -c MyFile.cu - ccbin“C:\Program Files(x86)\ Microsoft Visual Studio 10.0 \VC\bin” 我安装了CUDA Toolkit 5.5版以及Visual C ++ 2010 Express。我没有完整版的Visual Studio。 我收到 ..
发布时间:2016-10-20 22:52:44 C/C++开发

推力按键按飞行或不同的方法?

我想知道是否可以通过使用Thrust库的键排序,而不需要创建一个Vector来存储键(在飞行中)。例如,我有以下两个向量:键和值: vectorKeys:0,1,2,0,1,2 ,0,1,2 VectorValues:10,20,30,40,50,60,70,80,90 按键排序后: thrust :: sort_by_key(vKeys.begin ) ..
发布时间:2016-10-20 22:41:56 C/C++开发

CUDA cudaMalloc

我开始写一个新的CUDA应用程序。然而,我沿着一条有趣的弯路。 调用变量x上的第一个cudaMalloc,第一次失败。但是当我第二次调用它时,它返回cudaSuccess。最近升级到CUDA 4.0 SDK,这是一个很奇怪的错误。 我甚至做了一些测试,似乎第一次调用cudaMalloc失败。 解决方案 第一次调用任何cuda库函数都会启动一个初始化子程序。它可能发生,不知何故初始化 ..
发布时间:2016-10-20 22:22:05 C/C++开发

编译CUDA示例会产生构建错误

我运行Windows 7 64位,使用Visual Studio 2008.我安装了CUDA驱动程序和SDK。 SDK附带了很多例子,包括编译的可执行文件和源代码。编译的可执行文件运行奇妙。当我打开vc90解决方案,去建立在Win32配置我得到这个错误: 错误1致命错误LNK1181:输入文件'.\Release\bandwidthTest.cu.obj'bandwidthTest band ..
发布时间:2016-10-20 21:36:08 C/C++开发

Cuda:最小二乘解,速度差

最近,我使用Cuda来编写一个称为“正交匹配追踪”的算法。在我丑陋的Cuda代码中,整个迭代需要60秒,而Eigen只需要3秒... 在我的代码中,Matrix A是[640,1024]是[640,1],在每个步骤中,从A中选择一些向量以构成称为A_temp [640,itera],iter = 1:500的新矩阵。 我想从A_temp * x_temp = y获取x_temp [it ..
发布时间:2016-10-20 08:51:54 C/C++开发

rint不存在于Visual Studio 2010 math.h和等效的CUDA rint

我将CUDA代码移植到C ++并使用Visual Studio 2010. CUDA代码使用 rint 函数,它似乎不存在于Visual Studio 2010 math.h,所以看起来我需要自己实现它。 根据链接,CUDA rint / p> 以浮点格式将x四舍五入为最接近的整数值,中间的情况向零舍入。 我想我可以使用转换 int ,它舍弃小数部分,有效地向零舍入,所以我结束了 ..
发布时间:2016-10-19 21:19:08 C/C++开发

Cuda:固定内存零复制问题

我尝试过此链接中的代码是否是CUDA固定内存零拷贝? 请求声明该程序对他工作正常的人 但是在我的 上不工作,如果我在内核中操作它们的值不会改变。 基本上我的问题是,我的GPU内存不够,但我想做计算,需要更多的内存。我的程序使用RAM内存,或主机内存,并能够使用CUDA进行计算。链接中的程序似乎解决了我的问题,但是代码没有给出输出显示的家伙。 零复制内存上的任何帮助或任何工作示例将 ..
发布时间:2016-10-19 21:10:47 C/C++开发