对任意CUDA应用程序进行性能分析 [英] Profiling arbitrary CUDA applications

查看：75 发布时间：2021/4/27 20:09:52 linux cuda nvprof nvvp

本文介绍了对任意CUDA应用程序进行性能分析的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我当然知道 nvvp 和 nvprof 的存在，但是出于各种原因， nvprof 不想与我的应用一起使用涉及很多共享库. nvidia-smi 可以挂接到驱动程序中以了解正在运行的程序，但是我找不到让 nvprof 附加到正在运行的进程的好方法.

I know of the existence of nvvp and nvprof, of course, but for various reasons nvprof does not want to work with my app that involves lots of shared libraries. nvidia-smi can hook into the driver to find out what's running, but I cannot find a nice way to get nvprof to attach to a running process.

有一个标记-profile-all-processes ，它实际上确实给我一个消息"NVPROF正在分析过程12345"，但是没有进一步打印出来.我正在使用CUDA 8.

There is a flag --profile-all-processes which does actually give me a message "NVPROF is profiling process 12345", but nothing further prints out. I am using CUDA 8.

在这种情况下如何获得CUDA内核的详细性能细分?

How can I get a detailed performance breakdown of my CUDA kernels in this situation?

对任意CUDA应用程序进行性能分析 [英] Profiling arbitrary CUDA applications

问题描述

推荐答案

相关文章

服务器开发最新文章

热门教程

热门工具

登录关闭

对任意CUDA应用程序进行性能分析 [英] Profiling arbitrary CUDA applications

问题描述

推荐答案

相关文章

服务器开发最新文章

热门教程

热门工具

登录 关闭

登录关闭