分类:其它硬件开发

其它硬件开发

如何在代码C中为类型void ** ptr创建Fortran接口

我是新的使用Fortran,并为ac功能如下: cudaError_t cudaMalloc(void ** devPtr,size_t size) 在设备上分配线性内存的大小字节,并以* devPtr返回指向分配的内存的指针。所分配的存储器针对任何种类的变量适当地对齐。内存不被清除。 cudaMalloc()在失败的情况下返回cudaErrorMemoryAllocation。

IT屋 2017/3/5 19:40:24 喜欢

其它硬件开发

cudaStream性能奇怪

我尝试使用cudaStream开发一个sobel的例子。这是程序: void SobelStream(void) { cv :: Mat imageGrayL2 = cv :: imread(“/ home / xavier / Bureau / Image1.png”,0); u_int8_t * u8_PtImageHost; u_int8_t * u8_PtI

IT屋 2017/3/5 19:40:08 喜欢

其它硬件开发

cudaDeviceSynchronize在启动后返回错误代码4

我使用CUDA编写了一个简单的矩阵乘法代码,当我为 A(10000 * 10000)* B(10000 * 10000)接收此消息: cudaDeviceSynchronize在启动 后返回错误代码4 在添加这些说明以测量运行时间后,我收到“未指定的启动失败”错误。 cudaEventRecord(start); //这里是我的内核调用 cudaEventRe

IT屋 2017/3/5 19:39:44 喜欢

其它硬件开发

我应该在什么时候使用CUDA的内置warpSize,而不是我自己的常数?

nvcc设备代码可以访问内置值 warpSize ,该值设置为执行内核的设备的warp大小(即32,对于可预见的未来)。通常你不能告诉它除了一个常数 - 但如果你试图声明一个长度warpSize的数组你得到一个投诉,它是非常数...(使用CUDA 7.5) 所以,至少为了这个目的,你有动机去(编辑): code> enum:unsigned int {warp_size = 32};

IT屋 2017/3/5 19:39:28 喜欢

其它硬件开发

如何使用cula设备

我对如何使用cula设备界面有点困惑。 现在,我在cpp文件中使用cula接口,并且从cu文件生成一些随机数。 cu文件: ... __global__ void kernel(double * A,double * B,curandState * globalState,int Asize,int Bsize) { //生成随机数 ... void kerne

IT屋 2017/3/5 19:39:15 喜欢

其它硬件开发

将四个嵌套循环转换为CUDA内核

我写的CUDA程序,添加模糊效果到BMP文件。我写了工作程序,这样做在CPU上,现在我试图将代码转换为CUDA。这是我想在CUDA上工作的函数: void blur(bitmap_header * hp,unsigned char * data) { int xx,yy,x,y,avgB,avgG,avgR,ile; int blurSize = 5; for(xx = 0;

IT屋 2017/3/5 19:39:02 喜欢

其它硬件开发

将程序移植到CUDA - 内核在另一个内核?

我试图并行化包含几个过程的函数。函数为: void _myfunction(M1,M2){ for(a = 0; a< A ; a ++){ Amatrix = procedure1(M1)/ *包含for循环* /; Bmatrix = procedure2(M1)/ *包含for循环* /; ... for(z = 1; z 使用Amatrix(z)计算并获得AAm

IT屋 2017/3/5 19:38:50 喜欢

其它硬件开发

CUDA未知错误

我想从 CudaSift运行 mainSift.cpp 在Nvidia Tesla M2090上。首先,如此问题中所述,我有从 sm_35 更改为 sm_20 CMakeLists.txt 。 Unfortunatley现在返回此错误: checkMsg错误:LaplaceMulti()执行失败 在文件< /ghome/rzhengac/Downloads/CudaSift/cuda

IT屋 2017/3/5 19:38:38 喜欢

其它硬件开发

Cuda:紧凑和结果尺寸

我尝试使用CUDA查找具有3D坐标的对象之间的距离。也就是说,我只对2种类型的对象感兴趣。对象表示为数组中的数字。对于这个问题,我只想获得第一类对象(用户指定的数字)在对象数组中的位置。 为此目的,我目前尝试将此列表和结果列表传递到我的设备,并让设备检查数组中的每个位置是否是指定的数字(表示第一个对象) - 如果是,将该数组位置放在要返回的结果数组中 作为示例输入,假设我有:

IT屋 2017/3/5 19:38:23 喜欢

其它硬件开发

向量添加在CUDA使用流

我是CUDA并行编程的初学者。我尝试使用CUDA流向量添加程序。当我编译,我得到以下错误。 解决方案不正确。 解决方案与第0行的预期结果不匹配。期望(1 + 0.5 = 1.5)但得到0。 cuda通过示例书和类似问题在线。找不到解决方案。任何人都可以帮我解决这个错误?提前感谢。 #include< wb.h> #define wbCheck(stmt)do {\ c

IT屋 2017/3/5 19:37:57 喜欢