nvvp相关内容

对任意CUDA应用程序进行性能分析

我当然知道 nvvp 和 nvprof 的存在,但是出于各种原因, nvprof 不想与我的应用一起使用涉及很多共享库. nvidia-smi 可以挂接到驱动程序中以了解正在运行的程序,但是我找不到让 nvprof 附加到正在运行的进程的好方法. 有一个标记-profile-all-processes ,它实际上确实给我一个消息"NVPROF正在分析过程12345",但是没有进一步打印出来. ..
发布时间:2021-04-27 20:09:52 服务器开发

如何观察可执行文件子部分的CUDA事件和指标(例如,仅在内核执行期间)?

我熟悉使用nvprof来访问基准事件和指标,例如 nvprof --system -在--print-gpu-trace -o上进行概要分析(文件名)--events inst_issued1 ./基准名称 --print-gpu-trace -o(文件名) 命令提供开始时间,内核结束时间,功率,温度的时间戳记,并将信息保存到nvvp文件中,以 ..
发布时间:2020-10-13 00:42:15 其他开发

CUDA Visual分析器通过远程X会话

我运行的是Ubuntu 11.10服务器,CUDA-5.0和GTX480。我试图在Windows 8上使用Xming和Cygwin / X远程运行可视化分析器。我可以成功运行xclocks,但是当我尝试从putty命令行启动/usr/local/cuda-5.0/bin/nvvp时,它只是默默退出,没有任何错误或警告。 我安装了Cygwin / X的默认配置与xorg-server,xini ..
发布时间:2017-03-05 18:57:29 其它硬件开发

nvvp和nsight的profiler给出不同的结果?

我想尝试gst_inst_128bit指令。 在同一个程序中,nvvp给了很多gst_inst_128bit命令执行。 在nsight的profiler中,获取4次gst_inst_32bit指令。 它们应该是一个相同的程序。 在Linux,CUDA 5.0,GTX 580上试验了这个实验。 程序只是将数据从一个数组复制到另一个数组内核函数: 在main中: cudaMal ..
发布时间:2017-03-05 18:54:44 其它硬件开发

Cuda零拷贝性能

任何人都有使用零拷贝分析CUDA应用程序的性能的经验(参考这里:默认固定内存VS零复制内存)内存模型? 我有一个内核使用零复制功能和NVVP我看到以下内容: 在平均问题大小上运行内核我获得0.7%的指令重放开销,所以没有什么主要。所有这0.7%是全局内存重放开销。 当我真正解决问题大小时,我得到的指令重放开销为95.7%,所有这些都是由于全局内存重放开销。 然而,正常问题大 ..
发布时间:2016-10-20 23:17:05 C/C++开发