cuda相关内容

神秘的赛格故障与Cudamalloc

谁能帮我理解为什么以下code使分段错误? 同样,谁能帮助我理解为什么换出标有“坏”的标记为“好”两线两线不分割故障导致? 注意,赛格故障似乎在cudaMalloc线出现;如果我评论说出来我也看不出分割故障。这些分配似乎是相互加强的,但我不明白怎么。 在code的意图是建立三个结构: h_P主机,它将由一个CPU常规填充上 D_P的装置中,这将通过一个GPU例程来填充上 h_P_cop ..
发布时间:2016-08-23 12:20:23 C/C++

CUDA链接错误(库以DLL)

我试着去建立一个框架,以便能够使用CUDA code在几个游戏引擎。能够与所有想要的发动机架由两个主要部件进行通信。一个lib和DLL。该库包含所有功能(CUDA和普通C ++)和DLL函数作为桥梁,调用函数从库。 现在,一切正在运行奥凯直到我已经包含了.CU文件。当我建设,我发现了以下错误: 错误3错误LNK2019:​​解析外部符号_Add2And7函数引用“市民:无效__thiscall ..
发布时间:2016-08-23 12:18:05 C/C++开发

关于CUDA混乱统一的虚拟内存

我有统一的虚拟内存有些混乱。 链接背后的文档(的http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#unified-virtual-address-space)说,这时候可以使用... 当应用程序被运行作为一个64位的过程中,一个单一的地址空间用于在主机和计算能力2.0以及更高的所有设备。 但这个链接(的ht ..
发布时间:2016-08-23 12:17:41 C/C++开发

CUDA浮点precision

可以在此有人评论, 我想做一个向量的点积。我的浮向量[2080:2131]和[2112:2163],他们中的每一个含有52元素。 A [52] = {2080 2081 2082 ...... 2129 2130 2131}; B〔52] = {2112 2113 2114 ... ... 2161 2162 2163};的for(int i = 0; I< 52;我++) { ..
发布时间:2016-08-23 12:15:12 C/C++开发

用C的malloc内存损坏

我使用malloc问题。 我有一个名为 jacobi_gpu 至极函数被调用很多次: INT主(INT ARGC,CHAR *的argv []){ / * ... * / INT totalrot = 0; 而(nrot大于0){ ITER ++; nrot = jacobi_gpu(A,Q,TOL,dimmat); tot ..
发布时间:2016-08-23 11:14:55 C/C++

如何通过结构的阵列到GPU?

我有这样的结构: 结构节点 { INT * PTR; 时int k; } *应将d_ptr; 我怎么可以声明节点的数组并把它传递到GPU?问题是,我必须先分配的内存ptr的节点! 我有这个至今: INT N = 100; INT NumbOfNodes = 5; cudaMalloc((无效**)及d_NodeArr,sizeof的(节点)* NumbOfNodes); ..
发布时间:2016-08-23 11:11:50 C/C++

合并的全局存储器的写入使用哈希

我的问题是关于合并的全局写入一个集CUDA数组元素的动态变化。考虑下面的内核: __ global__无效 内核(INT N,为int * ODATA,为int * IDATA,为int *哈希) { INT I = blockIdx.x * blockDim.x + threadIdx.x; 如果(ⅰ&所述; n)的 ODATA [哈希[我] = IDATA [I] } ..
发布时间:2016-08-23 10:55:40 C/C++开发

检测NVIDIA GPU的CUDA无

我想提取一组相当有限的关于NVIDIA GPU的信息,而无需对CUDA库链接。这是唯一的信息的需要的是计算能力和名称GPU的多,这可能是有用的,但它不是必需的。在code应该写在C(或C ++)。这些信息将在配置时使用(当CUDA工具包不可用),并在运行时(当执行二进制文件不支持CUDA编译)表明支持的GPU为present在用户系统。 据我了解,这是有可能通过驱动程序API,但我不是很熟悉的东 ..
发布时间:2016-08-23 10:49:38 C/C++

是否有和没有括号循环使用C不同的方式处理?

我是通过在调试一些C / CUDA code,像踩着 为(UINT I = threadIdx.x; I< 8379; I + = 256) 总和+ = d_PartialHistograms [blockIdx.x + I * HISTOGRAM64_BIN_COUNT] 和我心乱如麻,因为调试是在一步路过它,虽然输出是正确的。我意识到,当我把花括号我的循环如下面的代码片段, ..
发布时间:2016-08-23 10:46:11 C/C++

从CUDA内核印刷

我写一个CUDA程序,并试图打印使用printf函数的CUDA内核里面的东西。但是,当我编译程序,然后我得到一个错误 错误:从__device __ / __ global__功能(“agent_movement_top”)调用主机功能(的“printf”)是不允许的 错误MSB3721:命令“”C:\\ Program Files文件\\ NVIDIA GPU计算工具包\\ CUDA \\ ..
发布时间:2016-08-23 10:33:09 C/C++

STL,iostream的,新的,删除C / C ++的CUDA

我可以使用STL,iostream的,新的,删除C / C ++为CUDA? 解决方案 如果您有费米级GPU(使计算能力> = 2.0),并使用CUDA 4.0或更高版本,那么这两个新和删除可用的编缉是在设备code使用。 STL容器和算法的iostream不支持。 如果你想使用“STL像”与CUDA运算,你可能有兴趣在推力模板库。它允许主机code键用的容器类型与GPU透明交互并实现了 ..
发布时间:2016-08-22 16:58:09 C/C++开发

CURAND和内核,在哪里产生?

我的动机:我使用的算法人口动力学模型,我想使用CUDA,以便能够使考虑在数值模拟大量的节点。虽然这是我第一次在GPU上运行的code,结果看上去很有希望至今。 上下文:我需要考虑随机噪音,它在复杂的系统,我的目标是学习的演变至关重要的作用。据我了解,随机数生成CUDA中能相比,在CPU上的类似操作是相当麻烦的。在本文档中我看到一个具有存储RNG的状态,并保持这种喂养这需要(生成和)内核(全局函数 ..
发布时间:2016-08-22 16:24:46 C/C++

CUDA上的二维数组

我想在 CUDA 动态地分配全球 2D 阵列。我怎样才能做到这一点? 在我的主,我打电话给我的内核在一个循环。但在此之前我所说的内核,我需要在 GPU 分配一些内存。内核调用后一个整数从GPU发送到CPU,告知问题是否得到解决或没有。结果 如果问题不解决,我不会释放旧的内存,因为是它的进一步需求,我应该分配新的内存到 GPU 和调用内核试。 一须藤code所示: INT N = 0,I ..
发布时间:2016-08-22 15:50:11 C/C++

对GPU进行结构的动态数组的内存分配

我有问题,通过结构的阵列GPU内核。我在此基础上的话题 - cudaMemcpy分段错误,然后我写了某事是这样的: 的#include<&stdio.h中GT; #包括LT&;&stdlib.h中GT;结构测试{ 的char *数组; };__global__无效内核(测试* dev_test){ 的for(int i = 0;我小于5;我++){ 的pri ..
发布时间:2016-08-22 15:49:43 C/C++

功能推力迭代CUDA的说法

我想实现使用CUDA :: Thurst迭代器,解决了一堆在GPU方程的GPU上运行微分方程求解程序,要到细节,这里是一小块code的: 的#include<推力/ device_vector.h> #包括LT&;推力/ transform.h> #包括LT&;推力/ sequence.h> #包括LT&;推力/ copy.h> #包 ..
发布时间:2016-08-22 15:46:47 C/C++开发

“链接器输入文件未使用的,因为链接尚未完成”试图安装Qt Creator的&放时; CUDA

我想上手使用C和CUDA使用Qt创建者的IDE。不幸的是我有从一开始的问题,不知道从哪里它来自哪里(如果它开始逐渐这将会是更容易识别)。 我基本上已经安装CUDA(和C),并已小试运行的程序,但我想用一个IDE,所以我使用上的指示安装Qt Creator的:的 HTTP://cudaspace.word$p$pss.com/2011/04/07/qt-creator-cuda -linux / ..
发布时间:2016-08-22 15:45:01 C/C++

时序内核启动CUDA中同时使用推力

内核CUDA启动一般都是异步的,它(据我所知)意味着,一旦CUDA内核立即展开控制权返回给CPU。 CPU继续做一些有益的工作,而GPU忙的数字运算 除非该CPU采用强行停滞的cudaThreadSynchronize()或 cudaMemcpy()。 现在我刚开始使用推力获得CUDA库。在推力的函数调用 同步或异步? 在换句话说,如果我调用推力::排序(D.begin(),D.end() ..
发布时间:2016-08-22 14:56:59 C/C++

每个主机线程创建CUDA流(多线程CPU)

我有一个多线程的CPU,我想CPU的每个线程能够推出一个单独的CUDA流。在单独的CPU线程会做在不同的时间不同的东西,所以有机会的话,他们不会重叠,但如果他们在同一时间推出了CUDA核心,我想它继续并行运行。 我是pretty相信这是可能的,因为在CUDA工具包文档部分3.2.5.5。它说:“甲流命令(可能由不同的主机线程发布)的序列。” 所以,如果我想实现这个我会做这样的事情。 无效的主 ..
发布时间:2016-08-21 21:59:58 C/C++开发