cuda相关内容

Visual Studio 2013是否支持Cuda 6?

Visual Studio 2013支持Cuda 6吗? 如果没有,是否有一个黑客可以使两者互相配合? 我看到升级到VS 2013的很多价值,因为它(VC ++)更好地实现了C ++ 11标准,CUDA 6的统一内存架构和其他改进。 解决方案 这是2014年9月,Cuda 6.5的生产版本已经发布,它与Visual Studio 2013一起工作。没有其他版本的Cuda与Vis ..
发布时间:2016-10-23 12:29:56 C/C++开发

大型跨平台软件项目的提示/资源

我要开始一个大型软件项目,涉及跨平台GUI和重数字处理。我计划在C ++和CUDA中编写大多数应用程序后端,并在Qt4中编写GUI。我计划使用Make作为我的构建系统。这将是一个只有两个开发人员的项目,一旦我得到相对远的将是一个开源项目。 我的主要问题是,有没有任何人有任何提示/资源用于开发软件的架构背后。 什么是一个好的结构您的文件的方法? (数字处理代码在一个单独的文件夹而不是gu ..
发布时间:2016-10-23 12:28:23 C/C++开发

CUDA小内核2d卷积 - 如何做到

我一直在试验CUDA内核,在500x500图像(但是我也可以改变尺寸)和一个非常小的2D内核(一个laplacian 2d内核,所以它是一个3x3内核)之间执行快速2D卷积。 我创建了一个CPU经典的实现(两个for循环,你想象的那么简单),然后我开始创建CUDA内核。 在尝试执行更快卷积的几个令人失望的尝试后,我最终得到了以下代码: http://www.evl.uic.edu/s ..
发布时间:2016-10-23 11:54:28 C/C++开发

使用CUDA和C ++ 11时出错

我使用CUDA 4.1和GCC 4.5 ...(FINALLY!CUDA支持GCC 4.5,但仍在等待GCC 4.6)。无论如何,是否可以使用C ++ 11与CUDA 4.1? 我试过传递: - 编译器选项“-std = c ++ 0x” 到nvcc,它在我身上引发了一堆错误: / usr / include / c ++ / 4.5 / exceptio ..
发布时间:2016-10-23 11:17:00 C/C++开发

如何在CUDA应用程序中构建最佳速度的数据

我试图写一个简单的粒子系统,利用CUDA做更新的粒子位置。现在我定义一个粒子有一个对象,一个位置用三个浮点值定义,一个速度也用三个浮点值定义。当更新粒子时,我将一个常数值添加到速度的Y分量以模拟重力,然后将速度添加到当前位置以得到新的位置。在内存管理方面,最好保持两个单独的浮点数组来存储数据或以面向对象的方式结构化。像这样: struct Vector { float x,y,z; ..
发布时间:2016-10-22 19:33:06 C/C++开发

CUDA编译器(nvcc)宏

有没有CUDA的#define编译器(nvcc)宏,我可以使用? (像_WIN32 for Windows等) 我需要这个头文件代码,这将是常见的nvcc和VC ++编译器。我知道我可以继续定义我自己的,并将其作为参数传递给nvcc编译器(-D),但如果有一个已经定义,这将是巨大的。 解决方案 __ CUDACC__ 我不认为这将是微不足道。检查以下主题 ..
发布时间:2016-10-22 19:27:14 C/C++开发

GPU共享内存库冲突

我想了解银行冲突的发生情况。 如果我在全局内存中有一个大小为256的数组,并且我在一个块中有256个线程,并且我想将数组复制到共享内存。因此每个线程复制一个元素。 shared_a [threadIdx.x] = global_a [threadIdx.x] pre> 这个简单的操作会导致银行冲突吗? 现在假设数组的大小大于线程数,所以我现在使用这个来将全 ..
发布时间:2016-10-22 18:42:37 C/C++开发

CUDA:在C ++中包装设备内存分配

我现在开始使用CUDA,不得不承认我对C API有点失望。我理解选择C的原因,但是语言是基于C ++,而是几个方面会更简单。设备内存分配(通过 cudaMalloc )。 我的计划是自己做,使用重载的 new 和RAII(两个备选)的新操作符 c $ c。我想知道是否有任何警告,我还没有注意到目前为止。代码似乎可以工作,但我仍然想知道潜在的内存泄漏。 RAII 代码如下: Cu ..
发布时间:2016-10-22 18:09:10 C/C++开发

使用推力对打包顶点进行排序

因此,我有一个PackedVertex结构的设备数组: struct PackedVertex { glm :: vec3顶点; glm :: vec2 UV; glm :: vec3 Normal; } 所述重复在所述阵列中聚集在一起;我根本不在乎整体顺序。 我试过通过比较向量的长度进行排序,但没有正确排序,所以现在我尝试每个变量使用3 s ..
发布时间:2016-10-22 16:56:03 C/C++开发

获取错误:“nvlink错误:未定义对”_ZN8Strategy8backtestEPddd“的引用

对于我的CUDA(v7.5)应用程序运行 make 时,会出现以下错误: nvlink错误:未定义对“_ZN8Strategy8backtestEPddd”的引用 不知道为什么。似乎有些事情可能是错误的我的Makefile。这里是 - 任何想法可能会导致错误?提前感谢! CC = nvcc CFLAGS = -std = c ++ 11 -m64 -arch ..
发布时间:2016-10-21 00:10:54 C/C++开发

Visual Studio - 过滤nvcc警告

我在写一个CUDA程序,但我得到了令人讨厌的警告: 警告:假设全局内存空间 这是来自nvcc,我无法禁用它。 p> 有没有办法过滤掉第三方工具(如nvcc)的警告? 以便过滤出来自自定义生成工具的输出窗口日志错误/警告。 解决方案 警告,我在此主题中找到帮助: link 。 您可以在nvcc命令行中删除-G标志, 如果您使用的是 ..
发布时间:2016-10-21 00:08:45 C/C++开发

如何从C ++传递字符串矩阵到Cuda内核

问题: 我有一个C ++中的字符串填充字符串,我想传递给cuda内核函数。我知道CUDA不能处理字符串,所以经过一些研究,我试过了一些解决方案如下所示。 尝试: 定义C ++中的指针数组,为每个单元格指定一个指针字符(为简单起见,tmp [i]被包含在前面引用的矩阵中的字符串填充) / p> C ++区 char * tmp [3]; int text_leng ..
发布时间:2016-10-21 00:07:44 C/C++开发

CUDA和C ++简单项目

我正在尝试创建一个CUDA + C ++项目。基本上是一个.cpp项目,它需要一些CUDA内核。所以我只是跟着这里的例子,这基本上添加两个向量。内核确实求和工作: 的 http://blog.norture.com/2012/10/gpu-parallel-programming-in-vs2012-with-nvidia-cuda/ 这里是代码, #include ..
发布时间:2016-10-21 00:04:38 C/C++开发

CUDA - 将内核链接到PTX函数

我可以使用PTX文件中包含的PTX功能作为外部设备功能将其链接到另一个应该调用该功能的.cu文件吗? 这是另一个问题来自 CUDA - 链接内核在一起,其中函数本身不包含在。 cu文件,但我宁愿有一个PTX函数以某种方式链接 解决方案 您可以加载包含PTX代码的文件在您自己的代码从文件系统 cuModuleLoad 和 cuModuleGetFunction 如下: CU模块 ..
发布时间:2016-10-21 00:00:06 C/C++开发