cuda 第119页 - IT屋-程序员软件开发技术分享社区

神秘的赛格故障与Cudamalloc

谁能帮我理解为什么以下code使分段错误？同样，谁能帮助我理解为什么换出标有“坏”的标记为“好”两线两线不分割故障导致？注意，赛格故障似乎在cudaMalloc线出现;如果我评论说出来我也看不出分割故障。这些分配似乎是相互加强的，但我不明白怎么。在code的意图是建立三个结构： h_P主机，它将由一个CPU常规填充上 D_P的装置中，这将通过一个GPU例程来填充上 h_P_cop ..

发布时间：2016-08-23 12:20:23 c cuda segmentation-fault C/C++

CUDA链接错误（库以DLL）

我试着去建立一个框架，以便能够使用CUDA code在几个游戏引擎。能够与所有想要的发动机架由两个主要部件进行通信。一个lib和DLL。该库包含所有功能（CUDA和普通C ++）和DLL函数作为桥梁，调用函数从库。现在，一切正在运行奥凯直到我已经包含了.CU文件。当我建设，我发现了以下错误：错误3错误LNK2019：解析外部符号_Add2And7函数引用“市民：无效__thiscall ..

发布时间：2016-08-23 12:18:05 c++ c dll cuda C/C++开发

关于CUDA混乱统一的虚拟内存

我有统一的虚拟内存有些混乱。链接背后的文档（的http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#unified-virtual-address-space)说，这时候可以使用... 当应用程序被运行作为一个64位的过程中，一个单一的地址空间用于在主机和计算能力2.0以及更高的所有设备。但这个链接（的ht ..

发布时间：2016-08-23 12:17:41 c++ c cuda C/C++开发

CUDA浮点precision

可以在此有人评论，我想做一个向量的点积。我的浮向量[2080：2131]和[2112：2163]，他们中的每一个含有52元素。 A [52] = {2080 2081 2082 ...... 2129 2130 2131}; B〔52] = {2112 2113 2114 ... ... 2161 2162 2163};的for（int i = 0; I＆LT; 52;我++） { ..

发布时间：2016-08-23 12:15:12 c++ c cuda C/C++开发

用C的malloc内存损坏

我使用malloc问题。我有一个名为 jacobi_gpu 至极函数被调用很多次： INT主（INT ARGC，CHAR *的argv []）{ / * ... * / INT totalrot = 0; 而（nrot大于0）{ ITER ++; nrot = jacobi_gpu（A，Q，TOL，dimmat）; tot ..

发布时间：2016-08-23 11:14:55 c malloc cuda gpu C/C++

如何通过结构的阵列到GPU？

我有这样的结构：结构节点 { INT * PTR; 时int k; } *应将d_ptr; 我怎么可以声明节点的数组并把它传递到GPU？问题是，我必须先分配的内存ptr的节点！我有这个至今： INT N = 100; INT NumbOfNodes = 5; cudaMalloc（（无效**）及d_NodeArr，sizeof的（节点）* NumbOfNodes）; ..

发布时间：2016-08-23 11:11:50 c cuda C/C++

合并的全局存储器的写入使用哈希

我的问题是关于合并的全局写入一个集CUDA数组元素的动态变化。考虑下面的内核： __ global__无效内核（INT N，为int * ODATA，为int * IDATA，为int *哈希） { INT I = blockIdx.x * blockDim.x + threadIdx.x; 如果（ⅰ＆所述; n）的 ODATA [哈希[我] = IDATA [I] } ..

发布时间：2016-08-23 10:55:40 c++ c cuda gpgpu C/C++开发

我想提取一组相当有限的关于NVIDIA GPU的信息，而无需对CUDA库链接。这是唯一的信息的需要的是计算能力和名称GPU的多，这可能是有用的，但它不是必需的。在code应该写在C（或C ++）。这些信息将在配置时使用（当CUDA工具包不可用），并在运行时（当执行二进制文件不支持CUDA编译）表明支持的GPU为present在用户系统。据我了解，这是有可能通过驱动程序API，但我不是很熟悉的东 ..

发布时间：2016-08-23 10:49:38 c cuda C/C++

是否有和没有括号循环使用C不同的方式处理？

我是通过在调试一些C / CUDA code，像踩着为（UINT I = threadIdx.x; I＆LT; 8379; I + = 256）总和+ = d_PartialHistograms [blockIdx.x + I * HISTOGRAM64_BIN_COUNT] 和我心乱如麻，因为调试是在一步路过它，虽然输出是正确的。我意识到，当我把花括号我的循环如下面的代码片段， ..

发布时间：2016-08-23 10:46:11 c debugging loops for-loop cuda C/C++

动态地分配device / global CUDA内核中的内存

根据 ..

发布时间：2016-08-23 10:44:22 c visual-studio-2010 cuda parallel-processing C/C++

从CUDA内核印刷

我写一个CUDA程序，并试图打印使用printf函数的CUDA内核里面的东西。但是，当我编译程序，然后我得到一个错误错误：从__device __ / __ global__功能（“agent_movement_top”）调用主机功能（的“printf”）是不允许的错误MSB3721：命令“”C：\\ Program Files文件\\ NVIDIA GPU计算工具包\\ CUDA \\ ..

发布时间：2016-08-23 10:33:09 c visual-studio-2010 cuda gpgpu C/C++

STL，iostream的，新的，删除C / C ++的CUDA

我可以使用STL，iostream的，新的，删除C / C ++为CUDA？解决方案如果您有费米级GPU（使计算能力> = 2.0），并使用CUDA 4.0或更高版本，那么这两个新和删除可用的编缉是在设备code使用。 STL容器和算法的iostream不支持。如果你想使用“STL像”与CUDA运算，你可能有兴趣在推力模板库。它允许主机code键用的容器类型与GPU透明交互并实现了 ..

发布时间：2016-08-22 16:58:09 c++ c stl cuda iostream C/C++开发

CURAND和内核，在哪里产生？

我的动机：我使用的算法人口动力学模型，我想使用CUDA，以便能够使考虑在数值模拟大量的节点。虽然这是我第一次在GPU上运行的code，结果看上去很有希望至今。上下文：我需要考虑随机噪音，它在复杂的系统，我的目标是学习的演变至关重要的作用。据我了解，随机数生成CUDA中能相比，在CPU上的类似操作是相当麻烦的。在本文档中我看到一个具有存储RNG的状态，并保持这种喂养这需要（生成和）内核（全局函数 ..

发布时间：2016-08-22 16:24:46 c cuda C/C++

CUDA上的二维数组

我想在 CUDA 动态地分配全球 2D 阵列。我怎样才能做到这一点？在我的主，我打电话给我的内核在一个循环。但在此之前我所说的内核，我需要在 GPU 分配一些内存。内核调用后一个整数从GPU发送到CPU，告知问题是否得到解决或没有。结果如果问题不解决，我不会释放旧的内存，因为是它的进一步需求，我应该分配新的内存到 GPU 和调用内核试。一须藤code所示： INT N = 0，I ..

发布时间：2016-08-22 15:50:11 c cuda C/C++

对GPU进行结构的动态数组的内存分配

我有问题，通过结构的阵列GPU内核。我在此基础上的话题 - cudaMemcpy分段错误，然后我写了某事是这样的：的#include＆LT;＆stdio.h中GT; ＃包括LT＆;＆stdlib.h中GT;结构测试{ 的char *数组; };__global__无效内核（测试* dev_test）{ 的for（int i = 0;我小于5;我++）{ 的pri ..

发布时间：2016-08-22 15:49:43 c struct cuda dynamic-memory-allocation C/C++

功能推力迭代CUDA的说法

我想实现使用CUDA :: Thurst迭代器，解决了一堆在GPU方程的GPU上运行微分方程求解程序，要到细节，这里是一小块code的：的#include＆LT;推力/ device_vector.h＆GT; ＃包括LT＆;推力/ transform.h＆GT; ＃包括LT＆;推力/ sequence.h＆GT; ＃包括LT＆;推力/ copy.h＆GT; ＃包 ..

发布时间：2016-08-22 15:46:47 c++ c cuda thrust C/C++开发

“链接器输入文件未使用的，因为链接尚未完成”试图安装Qt Creator的＆放时; CUDA

我想上手使用C和CUDA使用Qt创建者的IDE。不幸的是我有从一开始的问题，不知道从哪里它来自哪里（如果它开始逐渐这将会是更容易识别）。我基本上已经安装CUDA（和C），并已小试运行的程序，但我想用一个IDE，所以我使用上的指示安装Qt Creator的：的 HTTP：//cudaspace.word$p$pss.com/2011/04/07/qt-creator-cuda -linux / ..

发布时间：2016-08-22 15:45:01 c cuda qt-creator C/C++

时序内核启动CUDA中同时使用推力

内核CUDA启动一般都是异步的，它（据我所知）意味着，一旦CUDA内核立即展开控制权返回给CPU。 CPU继续做一些有益的工作，而GPU忙的数字运算除非该CPU采用强行停滞的cudaThreadSynchronize（）或 cudaMemcpy（）。现在我刚开始使用推力获得CUDA库。在推力的函数调用同步或异步？在换句话说，如果我调用推力::排序（D.begin（），D.end（） ..

发布时间：2016-08-22 14:56:59 c time cuda thrust C/C++

这有什么错铸像（无效**）及device_array？

有 ..

发布时间：2016-08-21 22:12:37 c cuda C/C++

每个主机线程创建CUDA流（多线程CPU）

我有一个多线程的CPU，我想CPU的每个线程能够推出一个单独的CUDA流。在单独的CPU线程会做在不同的时间不同的东西，所以有机会的话，他们不会重叠，但如果他们在同一时间推出了CUDA核心，我想它继续并行运行。我是pretty相信这是可能的，因为在CUDA工具包文档部分3.2.5.5。它说：“甲流命令（可能由不同的主机线程发布）的序列。” 所以，如果我想实现这个我会做这样的事情。无效的主 ..

发布时间：2016-08-21 21:59:58 c++ c multithreading cuda C/C++开发

cuda相关内容