nvcc相关内容
这个问题出现时,我尝试导入theano与gpu模式。当导入theano时,它试图编译一些代码,使其共享库并尝试加载它。 以下是生成so文件的命令。 nvcc -shared -O3 -m64 -Xcompiler -DCUDA_NDARRAY_CUH = mc72d035fdf91890f3b36710688069b2e,\ -DNPY_NO_DEPRECATED_API = NPY
..
我想从一个CUDA代码( kernel.cu )创建一个.dll文件,以便从外部C程序中使用这个库。经过一些尝试,我只是在.cu文件中留下一个简单的C函数。代码如下: kernel.cu #include #include“kernel.h” void hello(const char * s){ printf(“Hello%s\\\ ”,s);
..
我在Visual Studio 2013,Windows 10,CMake 3.5.1。 使用标准C ++正常编译,例如: CMakeLists.txt 项目(测试) add_definitions D“WINDOWS_DLL_API = __ declspec(dllexport)”) add_definitions(/ D“FOO = 1”) 设置(PROJECT
..
当我尝试在64位Windows 7上使用VS 2010在Debug 64位配置中构建我的项目时遇到此错误以及其他两个错误。 错误:连接规范与math.h中之前的“hypot”不兼容第161行 错误:连接规范与math.h中之前的“hypotf”不兼容第161行 错误:function“abs(long long) “已经在math_functions.h line 534中定义了
..
在一个应用程序中,我有一堆CUDA内核。有些使用动态并行性,有些不使用。为了在不支持此功能的情况下提供后备选项,或只需允许应用程序继续,但可以使用减少/部分可用的功能,我该如何进行编译? 此时,当使用 -arch = sm_35 无效的设备函数 c $ c>在670(最大 sm_30 ),不需要计算3.5。 AFAIK不使用多个 -arch = sm _ * 参数并使用多个 -genc
..
对于我当前的项目,我需要在同一个项目中使用CUDA和Intel C / C ++编译器。 (我依赖于英特尔的MKL的SSYEV实现,使用GCC + MKL而不是ICC + MKL(从GCC接近3ms,从ICC接近300μs)大约需要10倍的时间。 icc -v icc version 12.1.5 NVIDIA声明,支持Intel ICC 12.1( http://
..
我正在测试新的CUDA 8以及Pascal Titan X GPU,并期待加快我的代码,但由于某种原因,它最终会变慢。 以下是可以重现结果的最低代码: CUDASample.cuh class CUDASample { public: void AddOneToVector(std :: vector& in); }; CUDASampl
..
CUDA编译器具有生成32位或64位PTX的选项。这些之间有什么区别?是否喜欢x86,NVidia GPU实际上有32位和64位ISA? 解决方案 指针肯定是最明显的区别。 64位机器型号启用64位指针。 64位指针支持多种功能,例如大于4GB的地址空间,统一虚拟寻址。统一虚拟寻址又启用其他功能,例如 GPUDirect对等-Peer 。 CUDA IPC API 也取决于64位机器型号。
..
我在我的Ubuntu虚拟机上安装了CUDA 5.0和NVCC,并且编译即使是基本的CUDA C程序也有问题。错误如下: 用户@ ubuntu:〜/ CUDA $ nvcc helloworld.cu -o helloworld.o -target- cpu-arch = ARM -ccbin = / usr / bin / arm-linux-gnueabi-gcc-4.6 --machin
..
我们要使用cuPrintf()做什么? (设备计算能力1.2,Ubuntu 12)我找不到“cuPrintf.cu”和“cudaPrintf.cuh”,所以我下载他们的代码,并包括他们: #include“cuPrintf.cuh” #include“cuPrintf.cu” b $ b 顺便说一句,这是剩下的代码: __ global__ void hello_k
..
我试图编译一个内核,使用动态并行运行CUBLAS到cubin文件。 当我尝试使用命令编译代码 nvcc -cubin -m64 -lcudadevrt -lcublas_device -gencode arch = compute_35,code = sm_35 -o test.cubin -c test.cu $ c> ptxas fatal:unresolved
..
我正在编写一个使用表面(对纹理重新取样和写入)的库来获得性能提升: ... surface my_surf2D; //允许写纹理 ... 目标平台GPU具有计算能力2.0,我可以编译我的代码: nvcc -arch = sm_20 ... 问题是当我试图开发时并调试我的笔记本电脑上的库,它有一个NVIDIA ION GPU
..
编译CUDA代码时,必须选择要为其生成代码的体系结构。 nvcc 提供两个参数来指定此架构,基本上是: arch 指定虚拟arquictecture,它可以是 compute_10 , compute_11 等。 代码指定真正的架构,可以是 sm_10 , sm_11 等。 所以这样的命令: nvcc x.cu -arch = compute_13 -code = sm_13
..
我正在测量GPU上的峰值单精度触发器,因为我正在修改PTX文件以对寄存器执行连续的MAD指令。不幸的是,编译器删除所有的代码,因为它实际上没有什么有用的,因为我不执行任何加载/存储的数据。是否有编译器标志或编译指令添加到代码,以便编译器不会碰它? 谢谢。 解决方案 我不认为有任何方法来关闭这样的优化在编译器。您可以通过添加代码来存储您的值,并将该代码包装在总是false的条件语句中来
..
有没有CUDA的#define编译器(nvcc)宏,我可以使用? (像_WIN32 for Windows等) 我需要这个头文件代码,这将是常见的nvcc和VC ++编译器。我知道我可以继续定义我自己的,并将其作为参数传递给nvcc编译器(-D),但如果有一个已经定义,将是巨大的。 解决方案 __ CUDACC__ 我不认为这将是微不足道。检查以下主题:
..
我试图使用CUDA工具包版本5.0和Visual Studio 2010 Professional编译器从命令行编译CUDA代码。响应以下内容, nvcc -c AddVectors.cu -ccbin“C:\Program Files(x86)\ Microsoft Visual Studio 10.0 \VC\bin“ 我收到以下错误消息 nvcc:致命错误:
..
我正在使用Visual C ++ Express 2010扩展的Windows SDK 7.1(添加64位编译器)构建64位应用程序。当我在32位模式使用nvcc它工作得很好。当我使用它在64位模式下,我得到这个错误: nvcc致命:Visual Studio配置文件'找不到安装在'C:\Program Files(x86)\Microsoft Visual Studio 10.0 \VC
..
我有一个程序使用三个内核。为了得到加速,我做一个虚拟内存副本创建一个上下文如下: __ global__ void warmStart * f) { * f = 0; } 这是在我想要的内核之前启动的,如下所示: int * dFlag = NULL; cudaMalloc((void **)& dFlag,sizeof(int)); warmSt
..
我在安装Visual C ++ Express 2010之后尝试运行 pycuda入门教程,各种Nvidia驱动程序,SDK等。我得到 mod = SourceModule(“”“ __global__ void doublify(float * a) { int idx = threadIdx.x + threadIdx.y * 4; a [idx] * = 2; } “ “
..
我想从Windows命令行使用 nvcc -ptx ,但我总是得到这个错误信息: nvcc:fatal error:Microsoft Visual Studio配置文件找不到'vcvars64.bat'在'C:\Program Files(x86)\ Microsoft Visual S tudio 11.0 \VC\bin /../..' 我使用vs 2012 express版。可以
..