nvcc相关内容

nvcc选择错误的libcudart库

这个问题出现时,我尝试导入theano与gpu模式。当导入theano时,它试图编译一些代码,使其共享库并尝试加载它。 以下是生成so文件的命令。 nvcc -shared -O3 -m64 -Xcompiler -DCUDA_NDARRAY_CUH = mc72d035fdf91890f3b36710688069b2e,\ -DNPY_NO_DEPRECATED_API = NPY ..
发布时间:2017-03-05 19:00:06 其它硬件开发

使用nvcc从CUDA创建DLL

我想从一个CUDA代码( kernel.cu )创建一个.dll文件,以便从外部C程序中使用这个库。经过一些尝试,我只是在.cu文件中留下一个简单的C函数。代码如下: kernel.cu #include #include“kernel.h” void hello(const char * s){ printf(“Hello%s\\\ ”,s); ..
发布时间:2017-03-05 15:29:31 其它硬件开发

VS2010编译器和cuda错误:链接规范不兼容以前的“hypot”

当我尝试在64位Windows 7上使用VS 2010在Debug 64位配置中构建我的项目时遇到此错误以及其他两个错误。 错误:连接规范与math.h中之前的“hypot”不兼容第161行 错误:连接规范与math.h中之前的“hypotf”不兼容第161行 错误:function“abs(long long) “已经在math_functions.h line 534中定义了 ..
发布时间:2017-03-04 16:08:18 其它硬件开发

编译CUDA与动态并行性回退 - 多架构/计算能力

在一个应用程序中,我有一堆CUDA内核。有些使用动态并行性,有些不使用。为了在不支持此功能的情况下提供后备选项,或只需允许应用程序继续,但可以使用减少/部分可用的功能,我该如何进行编译? 此时,当使用 -arch = sm_35 无效的设备函数 c $ c>在670(最大 sm_30 ),不需要计算3.5。 AFAIK不使用多个 -arch = sm _ * 参数并使用多个 -genc ..
发布时间:2017-03-04 15:50:13 其它硬件开发

CUDA 5.5& Linux上的Intel C / C ++编译器

对于我当前的项目,我需要在同一个项目中使用CUDA和Intel C / C ++编译器。 (我依赖于英特尔的MKL的SSYEV实现,使用GCC + MKL而不是ICC + MKL(从GCC接近3ms,从ICC接近300μs)大约需要10倍的时间。 icc -v icc version 12.1.5 NVIDIA声明,支持Intel ICC 12.1( http:// ..
发布时间:2017-03-04 15:34:41 服务器开发

CUDA / PTX 32位与64位

CUDA编译器具有生成32位或64位PTX的选项。这些之间有什么区别?是否喜欢x86,NVidia GPU实际上有32位和64位ISA? 解决方案 指针肯定是最明显的区别。 64位机器型号启用64位指针。 64位指针支持多种功能,例如大于4GB的地址空间,统一虚拟寻址。统一虚拟寻址又启用其他功能,例如 GPUDirect对等-Peer 。 CUDA IPC API 也取决于64位机器型号。 ..
发布时间:2017-03-04 15:10:46 其它硬件开发

NVCC CUDA交叉编译找不到“-lcudart”

我在我的Ubuntu虚拟机上安装了CUDA 5.0和NVCC,并且编译即使是基本的CUDA C程序也有问题。错误如下: 用户@ ubuntu:〜/ CUDA $ nvcc helloworld.cu -o helloworld.o -target- cpu-arch = ARM -ccbin = / usr / bin / arm-linux-gnueabi-gcc-4.6 --machin ..
发布时间:2017-03-04 15:01:13 服务器开发

我们如何使用cuPrintf()?

我们要使用cuPrintf()做什么? (设备计算能力1.2,Ubuntu 12)我找不到“cuPrintf.cu”和“cudaPrintf.cuh”,所以我下载他们的代码,并包括他们: #include“cuPrintf.cuh” #include“cuPrintf.cu” b $ b 顺便说一句,这是剩下的代码: __ global__ void hello_k ..
发布时间:2017-03-04 14:53:51 其它硬件开发

使用nvcc时,arch和代码选项的默认值是什么?

编译CUDA代码时,必须选择要为其生成代码的体系结构。 nvcc 提供两个参数来指定此架构,基本上是: arch 指定虚拟arquictecture,它可以是 compute_10 , compute_11 等。 代码指定真正的架构,可以是 sm_10 , sm_11 等。 所以这样的命令: nvcc x.cu -arch = compute_13 -code = sm_13 ..
发布时间:2017-03-04 14:42:48 其它硬件开发

完全禁用NVCC的优化

我正在测量GPU上的峰值单精度触发器,因为我正在修改PTX文件以对寄存器执行连续的MAD指令。不幸的是,编译器删除所有的代码,因为它实际上没有什么有用的,因为我不执行任何加载/存储的数据。是否有编译器标志或编译指令添加到代码,以便编译器不会碰它? 谢谢。 解决方案 我不认为有任何方法来关闭这样的优化在编译器。您可以通过添加代码来存储您的值,并将该代码包装在总是false的条件语句中来 ..
发布时间:2017-03-04 14:38:13 其它硬件开发

CUDA编译器(nvcc)宏

有没有CUDA的#define编译器(nvcc)宏,我可以使用? (像_WIN32 for Windows等) 我需要这个头文件代码,这将是常见的nvcc和VC ++编译器。我知道我可以继续定义我自己的,并将其作为参数传递给nvcc编译器(-D),但如果有一个已经定义,将是巨大的。 解决方案 __ CUDACC__ 我不认为这将是微不足道。检查以下主题: ..
发布时间:2017-03-04 14:24:01 C/C++开发

如何设置nvcc使用Visual C ++ Express 2010 x64从Windows SDK 7.1?

我正在使用Visual C ++ Express 2010扩展的Windows SDK 7.1(添加64位编译器)构建64位应用程序。当我在32位模式使用nvcc它工作得很好。当我使用它在64位模式下,我得到这个错误: nvcc致命:Visual Studio配置文件'找不到安装在'C:\Program Files(x86)\Microsoft Visual Studio 10.0 \VC ..
发布时间:2017-03-04 13:33:36 其它硬件开发

创建CUDA上下文的区别

我有一个程序使用三个内核。为了得到加速,我做一个虚拟内存副本创建一个上下文如下: __ global__ void warmStart * f) { * f = 0; } 这是在我想要的内核之前启动的,如下所示: int * dFlag = NULL; cudaMalloc((void **)& dFlag,sizeof(int)); warmSt ..
发布时间:2017-03-04 13:29:56 其它硬件开发