nsight-compute相关内容

NSight Compute表示:此设备不支持分析-为什么?

我有一台配备了NVIDA GTX 1050Ti GPU(计算能力6.1)的计算机,正在尝试在我用CUDA 11.4构建的程序中分析一个内核。我的操作系统发行版是Devuan GNU/Linux 4 Chimaera(~=Debian 11 Bullseye)。 NSight Compute启动我的程序,并在API调用后向我显示API调用,但当我到达第一次启动内核时,它在API调用清单的详细信 ..
发布时间:2022-04-25 14:28:17 其他开发

长记分板和短记分板(&r.t)分别是什么?(&x;Long&q;;和&q;Short&q;记分板W.r.t)MIO/L1TEX?

在最新的NVIDIA微体系结构中,出现了一个新的(?)taxonomyWARP停滞原因/WARP调度器状态。 此分类中的两个项目是: 短记分板-MIO队列操作的记分板依赖项。 长记分板-L1TEX操作的记分板依赖项。 我认为,其中使用";记分板";表示无序执行数据依赖关系跟踪(例如,请参阅here)。 我的问题: 形容词“短”或“长”描述什么?是一块 ..
发布时间:2022-02-27 20:14:55 其他开发

什么是“多头"?和“短"字样计分板MIO/L1TEX?

在最近的NVIDIA微体系结构中,有一个新的(?)此处). 我的问题: 形容词“短"是什么意思?或“多头"描述?它是单个记分牌的长度吗?两种不同的操作有两种不同的记分牌? MIO之间这种有点非直觉的二分法是什么意思-有些但不是全部都是内存操作;和L1TEX操作,它们都是内存操作吗?是二分法吗停滞原因仅仅是因为还是真正的硬件? 解决方案 NVIDIA GPU有两种指令分类: ..
发布时间:2021-04-27 20:11:07 其他开发

在Nsight Compute中解释计算工作负载分析

“计算工作量分析"显示不同计算管道的利用率.我知道在现代GPU中,整数和浮点管线是不同的硬件单元,可以并行执行.但是,不清楚哪个管道代表其他管道的哪个硬件单元.在网上也找不到关于管道的缩写和解释的任何文档. 我的问题是: 1) ADU,CBU,TEX,XU 的全名是什么?他们如何映射到硬件? 2)哪些管线使用相同的硬件单元(例如FP16,FMA,FP64使用浮点单元)? 3 ..
发布时间:2021-04-27 20:10:51 其他开发