nvcc相关内容

nvprof命令错误:找不到cupti64_102.dll

当我尝试在命令提示符下运行 nvprof 命令时,系统弹出Erros并说:“由于无法找到cupti64_102.dll,代码执行无法继续。重新安装程序可能会解决此问题。“ 我已安装CUDA Toolkit 10.2,但 cupti64_102.dll 不在 / bin 。 系统:Windows 10,Quadro K4200,CUDA10.2,CUDA Toolkit 10.2 ..
发布时间:2020-10-13 00:44:48 其他开发

禁止“无法动态确定堆栈大小”。警告?

我收到CUDA警告 ptxas警告:输入函数'_Z13a_test_kernelv'的堆栈大小不能为 静态确定。 现在,我知道它的意思了,并且有一个有关其发生原因的问题。我想抑制的警告(使用nvcc 10.x编译时)。我可以吗?如果是这样,我该在何处放置警告抑制 #pragma ? 解决方案 在使用nvcc进行编译时,添加 -Xptxas -suppress-st ..
发布时间:2020-10-07 00:07:03 其他开发

如何禁用特定的nvcc编译器警告

我想使用 nvcc 禁用特定的编译器警告,特别是 警告:不允许使用NULL引用 我正在处理的代码使用 NULL 引用是SFINAE的一部分,因此不可避免。 一个理想的解决方案是 #pragma 仅在我们要禁用警告的源文件中,但如果存在一个编译器标志,也可以将其仅关闭有问题的警告。 解决方案 实际上可以在具有NVCC的设备上禁用特定警告。 您需要将 -Xcudafe ..
发布时间:2020-10-06 23:43:03 其他开发

“不知道该怎么办” nvcc致命错误

我在Ubuntu终端中使用命令行。 我正在尝试编译CUDA_Compiler_Driver_NVCC.pdf中显示的三个文件 当我使用命令时在这3个文件的文档给出的代码行中,确实出现以下错误: nvcc fatal:不知道如何处理'-dc' 如果我在命令行中删除-dc,也会收到以下错误: nvcc fatal:不知道如何处理'-arch = sm = 20' 有人知 ..
发布时间:2020-10-06 20:46:02 其他开发

是否可以使编译器按功能使用快速运算符?

假设我有 template void foo(float* data, size_t length); 并且我想用-ffast-math编译一个实例(对于nvcc是--use-fast-math),而没有它的另一个实例. 这可以通过在单独的翻译单元中实例化每个变体,然后使用不同的命令行(使用和不使用开关)来编译每个变体来实现. 我的问题 ..

如何配置mex以将编译器标志传递给nvcc

使用nvcc编译mex文件时,由于mex无法识别它们,因此我一直难以将CUDA特有的编译器选项传递给nvcc编译器. 我找到了一些一些较新的版本, 但是问题是非常特定于用户的,并且mex编译器多年来已经发生了变化,所以我不知道该怎么做. 所以,我的具体问题是:我应该怎么做才能使mex将编译器标志传递给nvcc? 更通用一些:如何使mex将编译器标志传递给另一个编译器? 解决 ..
发布时间:2020-05-06 14:58:59 其他开发

链接错误:命令行中缺少DSO

我对使用Windows的Linux(使用Ubuntu 14.04 LTS 64bit)非常陌生,并且正尝试移植到我现有的CUDA项目上. 通过链接时 /usr/local/cuda/bin/nvcc -arch=compute_30 -code=sm_30,compute_30 -o Main.o Display.o FileUtil.o Timer.o NeuralNetwork.o ..
发布时间:2020-05-01 03:22:08 服务器开发

如何在Ipython Notebook上使用GPU?

OS:Ubuntu 14.04LTS 语言:Python Anaconda 2.7(keras,theano) 显卡:GTX980Ti CUDA:CUDA 7.5 我想使用我的GPU(GTX980Ti)在IPython Notebook上运行keras python代码 但是我找不到它. 我想测试以下代码.当我在Ubuntu终端上运行它时, 我的命令如下(它很好地使用了GPU.没 ..
发布时间:2020-04-25 10:23:12 其他开发

Nvcc具有与CUDA不同的版本

我安装了cuda 7,但是当我点击nvcc --version时,它会打印出6.5.我想在GTX 960卡上安装Theano库,但它需要nvcc 7.0. 香港专业教育学院试图重新安装CUDA,但它没有更新NVCC.当我运行apt-get install nvidida-cuda-toolkit时,它只能安装6.5. 如何将nvcc更新到7.0版? 解决方案 请按照官方安装指南卸载当 ..
发布时间:2020-04-23 10:52:38 服务器开发

使用CUDA显示GPU优于CPU的最简单可能示例

我正在寻找可以编码的最简洁的代码,这些代码可以用于CPU(使用g ++)和GPU(使用nvcc),GPU一直优于CPU。任何类型的算法都是可以接受的。 澄清:我真的在寻找两个短代码块,一个用于CPU(在g ++中使用C ++) GPU(在nvcc中使用C ++)的GPU优于其。最好在秒或毫秒的范围内。最短的代码对可能。 首先,我会重申我的评论:GPU是高带宽,高延迟。试图让GPU在纳秒级作业 ..
发布时间:2018-04-18 20:26:16 其他开发语言

使用nvcc编译器使用-G参数编译时,GPU性能不佳

我正在做一些测试,我意识到在编译时使用-G参数给我的性能比没有它。 我已经检查了文档Nvidia: - 设备调试(-G) 生成设备代码的调试信息。 但是,这并不能帮助我了解为什么给我这么糟糕的表现。 哪里生成这个调试信息?可能是这个糟糕表现的原因? 解决方案 使用 -G switch 禁用 nvcc 可能在设备代码中执行的大多数编译器优化。由于这个原因 ..
发布时间:2017-04-18 00:47:39 开发方法

__ldg在某些情况下导致执行时间较慢

我昨天已经发布了这个问题,但没有很好的收到,虽然我现在有固体的,请承担与我。以下是系统规格: Tesla K20m带331.67驱动程序, CUDA 6.0, Linux机器。 现在我有一个全局内存读应用程序,所以我试图优化它 __ ldg 在我读取全局内存的每个地方的指令。但是, __ ldg 根本没有提高性能,运行时间大约减少了4倍。所以我的问题是,如何用 __ ldg(glo ..
发布时间:2017-03-05 19:35:09 服务器开发

CUDA常量内存值不正确

我一直在阅读许多与常数记忆相关的SO问题,我仍然不明白为什么我的程序不工作。总体如下 Common.cuh __ constant__ int numElements; __global__ void kernelFunction(); Common.cu #include“Common.cuh” #include ..
发布时间:2017-03-05 19:11:27 其它硬件开发

CUDA - 链接内核在一起

我有一个CUDA内核在.cu文件和另一个CUDA内核到另一个.cu文件。我知道使用动态并行化我可以从父内核调用另一个CUDA内核,但我想知道是否有任何方式来做这个与一个子内核驻留到另一个.cu文件。 感谢 解决方案 可以。 关键是使用单独的编译与设备代码链接,这是可用nvcc 。由于使用动态并行性,这里真的没什么新鲜的。 这里有一个简单的例子: ch_kernel. ..
发布时间:2017-03-05 19:05:05 其它硬件开发

VS2010编译器和cuda错误:链接规范与先前的“hypot”不兼容。

当我尝试在64位Windows 7上使用VS 2010在Debug 64位配置中构建我的项目时,我得到此错误以及其他两个错误。 错误:链接规范与math.h中的以前的“hypot”不兼容161 错误:链接规范与math.h中的以前的“hypotf”不兼容161 错误:函数“abs(long long)”已在math_functions.h中定义534 I在32位构建中 ..
发布时间:2017-03-05 19:02:49 其它硬件开发