nvcc相关内容

如何在Google Colab中将标志传递给NVCC?

我想使用 __ device __ lambda,但它表示我需要传递'--expt-extended-lambda'标志. 我在colab中使用此环境. !wget https://developer.nvidia.com/compute/cuda/9.2/Prod/local_installers/cuda-repo-ubuntu1604-9-2-local_9.2.88-1_amd64 ..
发布时间:2021-04-27 20:12:56 其他开发

CUDA nvcc图书馆建设链

我的目标是: library2.so 正在使用 library1.so 和 mycode.o 正在使用(应该链接库) library2.so (也许还有 library1.so ). 源代码是(省略了一行头文件): library1.cu: __ device__ void func1_lib1(void){} library2.cu: #include"library1. ..
发布时间:2021-04-27 20:12:13 其他开发

支持CUDA 5的GPU上不受支持的GPU架构compute_30

我目前正在尝试在最新的CUDA工具包(版本11.1)上编译darknet.我有一个能够运行CUDA版本5(即GeForce 940M)的GPU.但是,在使用最新的cuda工具包重建Darknet时,它表示 nvcc致命:不支持的GPU架构'compute_30' compute_30适用于版本3,当我的gpu可以运行版本5时它怎么会失败我的代码是否有可能检测到了我的英特尔图形卡,而不是 ..
发布时间:2021-04-27 20:07:47 其他开发

如何为mexcuda编译器指定最低计算能力以编译mexfunction?

我在 .cu 文件中有一个CUDA项目,我想使用 mexcuda 编译为 .mex 文件.因为我的代码使用了64位浮点原子操作 atomicAdd(double *,double),该操作仅适用于计算能力为6.0或更高的GPU设备,所以我需要将其指定为我编译时标记. 在我的标准IDE中,这可以很好地工作,但是当使用 mexcuda 进行编译时,这并没有达到我想要的效果.在关于MathWork ..
发布时间:2021-04-23 19:55:08 其他开发

使用nvcc进行编译给出“没有这样的文件或目录".

我正在尝试在Ubuntu上使用nvcc编译CUDA代码.但是,当我这样做时,会得到以下输出: >制作/usr/local/cuda/bin/nvcc -m64 --ptxas-options =“-v" -gencode arch = compute_11,code = sm_11 -gencode arch = compute_13,code = sm_13 -gencode arch = c ..
发布时间:2021-04-19 20:28:27 其他开发

将内核链接在一起

我在.cu文件中有一个CUDA内核,在另一个.cu文件中有另一个CUDA内核。我知道通过动态并行性,我可以从父内核调用另一个CUDA内核,但是我想知道是否有任何方法可以将子内核驻留在另一个.cu文件中。 解决方案 是的。 关键是使用带有设备代码链接的单独编译,这是 nvcc可用。由于使用 dynamic,这已经是必需的并行性,这里确实没有什么新东西。 这里有个简单的例子: ..
发布时间:2020-10-13 01:38:34 其他开发

使用CreateProcess调用nvcc.exe

我们目前在CUDA上使用模拟JIT编译器,其中在某些文件上调用nvcc.exe并生成生成的.ptx文件。 bool executeWindowsProcess(ofstream& logFF){ STARTUPINFO si; PROCESS_INFORMATION pi; ZeroMemory(& si,sizeof(si)); si.cb = sizeof(si); ..
发布时间:2020-10-13 01:37:21 其他开发

何时将volatile与寄存器/局部变量一起使用

在CUDA中使用易失性限定符声明寄存器数组是什么意思? 当我尝试将volatile关键字与寄存器数组一起使用时,它删除了溢出的寄存器数内存到本地内存。 (即强制CUDA使用寄存器而不是本地内存)这是预期的行为吗? 我没有找到有关volatile的寄存器阵列使用方面的任何信息。 这是两个版本的ptxas -v输出 带有易变限定符 __volatile__浮点数组[32 ..
发布时间:2020-10-13 01:25:08 其他开发

main.obj:致命错误LNK1143:文件无效或损坏:COMDAT部分0x6没有符号

我在Windows 10机器上,我有2个文件,main.cpp和cuda.cu(我已经在Ubuntu上成功构建了这个项目,我试图使其在Windows上构建)。我将它们都编译为64位体系结构的目标文件。我当前安装了MS Visual Studio 2010,我知道它太旧了。如果您认为是造成此问题的原因,则可以安装2015。(我不这么认为。) 当我尝试使用命令链接两个文件时 nvcc m ..
发布时间:2020-10-13 01:19:08 其他开发

如何将标志传递给CMAKE中的nvcc编译器

我在 Cmake 中有一个C项目,其中嵌入了 cuda 内核模块。 我只想将-ptxas-options = -v 传递给 nvcc 以便查看 每个线程的寄存器使用次数和 每个块的共享内存使用情况。 通过搜索如何将标志传递给 Cmake 中的 nvcc ,我遇到了一个解决方案 add_compile_options(myprog PRIVATE $ ..
发布时间:2020-10-13 01:17:40 其他开发

为什么使用-gencode时编译后的二进制文件会变小?

为什么使用-gencode时编译后的二进制文件会变小? 我的GPU的能力是3.0。 NVCC选项: 没有 -gencode 选项: 1,780,520字节 -gencode = arch = compute_30,code = sm_30 : 1,719,080字节变得更小 -gencode = arch = compute_30,code = sm_30 ..
发布时间:2020-10-13 01:13:36 其他开发

cudart_static-何时需要?

由于CUDA运行时附带了较新的驱动程序(我可以在驱动程序下载页面中选择9.1或9.2),所以我的问题是:我的库(内部使用CUDA内核)应该与 -lcudart_static一起提供吗? ? 我在使用9.1 CUDA驱动程序的系统上启动用9.2编译的内核时遇到问题。确保我的媒体库在安装了最新CUDA驱动程序的任何地方都可以运行的最“兼容”方式是什么? (我已经在为虚拟体系结构进行编译) ..
发布时间:2020-10-13 00:55:36 其他开发

CUDA 8.0中的NVCC警告

我尝试执行nvcc时收到此警告。 我有cuda工具包8.0,我的系统中有Nvidia GTX 480。 nvcc警告:已弃用'compute_20','sm_20'和'sm_21'体系结构,并可能在以后的版本中将其删除(使用-Wno -deprecated-gpu-targets以禁止显示警告)。 有人可以解释这个警告吗? 请让我知道是否需要更多信息。 ..
发布时间:2020-10-13 00:55:32 其他开发

CUDA SASS飞往库宾

使用CuObjDump,可以使用 cuobjdump -sass 从Cubin文件生成SASS,但是有什么方法可以将SASS转换回Cubin。 解决方案 NVIDIA CUDA官方工具链中没有提供“汇编程序”。 NVIDIA工具链可以采用CUDA C / C ++或PTX,并将其转换为cubin或其他可执行格式。 但是,有一些社区开发的汇编程序: 也 ..
发布时间:2020-10-13 00:47:39 其他开发

nvprof命令错误:找不到cupti64_102.dll

当我尝试在命令提示符下运行 nvprof 命令时,系统弹出Erros并说:“由于无法找到cupti64_102.dll,代码执行无法继续。重新安装程序可能会解决此问题。“ 我已安装CUDA Toolkit 10.2,但 cupti64_102.dll 不在 / bin 。 系统:Windows 10,Quadro K4200,CUDA10.2,CUDA Toolkit 10.2 ..
发布时间:2020-10-13 00:44:48 其他开发

禁止“无法动态确定堆栈大小”。警告?

我收到CUDA警告 ptxas警告:输入函数'_Z13a_test_kernelv'的堆栈大小不能为 静态确定。 现在,我知道它的意思了,并且有一个有关其发生原因的问题。我想抑制的警告(使用nvcc 10.x编译时)。我可以吗?如果是这样,我该在何处放置警告抑制 #pragma ? 解决方案 在使用nvcc进行编译时,添加 -Xptxas -suppress-st ..
发布时间:2020-10-07 00:07:03 其他开发

如何禁用特定的nvcc编译器警告

我想使用 nvcc 禁用特定的编译器警告,特别是 警告:不允许使用NULL引用 我正在处理的代码使用 NULL 引用是SFINAE的一部分,因此不可避免。 一个理想的解决方案是 #pragma 仅在我们要禁用警告的源文件中,但如果存在一个编译器标志,也可以将其仅关闭有问题的警告。 解决方案 实际上可以在具有NVCC的设备上禁用特定警告。 您需要将 -Xcudafe ..
发布时间:2020-10-06 23:43:03 其他开发

“不知道该怎么办” nvcc致命错误

我在Ubuntu终端中使用命令行。 我正在尝试编译CUDA_Compiler_Driver_NVCC.pdf中显示的三个文件 当我使用命令时在这3个文件的文档给出的代码行中,确实出现以下错误: nvcc fatal:不知道如何处理'-dc' 如果我在命令行中删除-dc,也会收到以下错误: nvcc fatal:不知道如何处理'-arch = sm = 20' 有人知 ..
发布时间:2020-10-06 20:46:02 其他开发