nvidia相关内容

Tensorflow无法打开libcuda.so.1

我有一台配备GeForce 940 MX的笔记本电脑。我想启动Tensorflow并在gpu上运行。我从他们的教程页面安装了所有内容,现在当我导入Tensorflow时,我得到了 >>导入tensorflow为tf 我tensorflow / stream_executor / dso_loader.cc:128]在本地成功打开CUDA库libcublas.so 我tensorflow ..
发布时间:2020-10-13 00:55:45 其他开发

NVIDIA NVML驱动程序/库版本不匹配

当我运行 nvidia-smi 时,我收到以下消息: 初始化NVML失败:驱动程序/库版本不匹配 一个小时前,我收到了相同的消息,并且卸载了我的cuda库,我得以运行 nvidia-smi ,得到以下结果: 此后,我下载了 cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61- 1_amd64.deb 从 NVIDI ..
发布时间:2020-10-13 00:52:32 其他开发

练习计算CUDA的网格大小

dim3块(4,2) dim3网格((nx + block.x-1)/block.x,(ny.block.y-1)/ block.y); 我在第53页的Professional CUDA C编程中找到了此代码。这只是一个简单的例子矩阵乘法。 nx 是列数, ny 是行数。 您能解释一下如何计算网格大小吗?为什么将 block.x 添加到 nx 然后减去 1 ? ..
发布时间:2020-10-13 00:50:06 其他开发

如何找到活跃的SM?

是否可以通过任何方式了解空闲/活动SM的数量?还是至少要读取每个SM的电压/功率或温度值,才能知道其是否正常工作? (在gpu设备上执行某些作业时实时)。 %smid帮助我了解了每个SM的ID。 感谢和问候, Rakesh 解决方案 CUDA分析工具接口( CUPTI )包含事件API可以对GPU PM计数器进行运行时采样。 CUPTI SDK随CUDA Toolkit一起提 ..
发布时间:2020-10-13 00:47:32 其他开发

nVIDIA驱动程序如何将设备索引分配给GPU?

假设在单个节点上,有几个具有不同计算功能的设备,nvidia如何对其排序(按级别,我是指cudaSetDevice分配的数字)? 是关于此有任何一般性准则吗?谢谢。 解决方案 我相信与 cudaGetDevice 和 cudaSetDevice (即CUDA运行时枚举顺序应基于启发式方法,该方法确定最快的设备并使其成为第一个,或者基于 PCI枚举顺序。您可以使用 deviceQuer ..
发布时间:2020-10-13 00:45:45 其他开发

nvprof命令错误:找不到cupti64_102.dll

当我尝试在命令提示符下运行 nvprof 命令时,系统弹出Erros并说:“由于无法找到cupti64_102.dll,代码执行无法继续。重新安装程序可能会解决此问题。“ 我已安装CUDA Toolkit 10.2,但 cupti64_102.dll 不在 / bin 。 系统:Windows 10,Quadro K4200,CUDA10.2,CUDA Toolkit 10.2 ..
发布时间:2020-10-13 00:44:48 其他开发

如何理解“ warp中的所有线程同时执行相同的指令”。在GPU中?

我正在阅读专业CUDA C编程,然后在 GPU体系结构概述部分: CUDA采用单指令多线程(SIMT)架构来管理和以32个称为warp的组执行线程。线程束中的所有线程同时执行同一条指令。每个线程都有其自己的指令地址计数器和寄存器状态,并根据自己的数据执行当前指令。每个SM将分配给它的线程块划分为32个线程扭曲,然后调度在可用硬件资源上执行。 SIMT体系结构类似于SIMD(单指令,多数 ..
发布时间:2020-10-13 00:43:25 其他开发

在一个GPU上运行多个CUDA应用程序

CUDA文档没有具体说明可以共享一个GPU的CUDA进程数。例如,如果我由同一用户在系统中仅安装了一张GPU卡的情况下启动了多个CUDA程序,那会有什么效果?会保证执行的正确性吗?在这种情况下,GPU如何安排任务? 解决方案 来自独立主机进程的CUDA活动通常会创建独立的CUDA 上下文,每个过程一个。因此,从单独的主机进程启动的CUDA活动将在同一设备上的单独CUDA上下文中进行。 ..
发布时间:2020-10-13 00:39:33 其他开发

如何选择要在哪个GPU上运行作业?

在多GPU计算机中,如何指定CUDA作业应在哪个GPU上运行? 例如,在安装CUDA时,我选择安装 NVIDIA_CUDA- _Samples 然后运行 nbody 模拟的几个实例,但是它们都在一个GPU 0上运行; GPU 1完全闲置(使用 watch -n 1 nvidia-dmi 进行监视)。使用 echo $ CUDA_VISIBLE_DEVICES 检查 CU ..
发布时间:2020-10-13 00:39:05 其他开发

CUDA GPU是按位置选择的,但是如何将default设置为设备0以外的值?

我最近在家中的机器上安装了第二个GPU(Tesla K40),我的搜索建议第一个PCI插槽成为为CUDA作业选择的默认GPU。一个很棒的链接正在解释它,可以在这里找到: 默认GPU分配 我原来的GPU是TITAN X,也启用了CUDA,但实际上最适合单个精度计算,特斯拉更好地实现了双精度。对于该小组,我的问题是是否有办法将我的默认CUDA编程设备始终设置为第二个?显然,我每次都可以在代 ..
发布时间:2020-10-13 00:37:27 其他开发

如何使tensorflow在具有2.x功能的GPU上运行?

我已经在Linux Ubuntu 16.04上成功安装了tensorflow(GPU),并进行了一些小改动,以便使其能够与新的Ubuntu LTS版本一起使用。 但是,我以为(谁知道为什么)我的GPU满足了计算能力大于3.5的最低要求。情况并非如此,因为我的 GeForce 820M 只有2.1。我可以问这个问题,因为显然没有办法在Ubuntu 16.04上运行tensorflow GPU版 ..
发布时间:2020-10-13 00:33:01 其他开发

使用python ctypes与nvapi交互(跟随演示代码)

这是我先前的问题的后续解答:有关python ctypes和nvapi的帮助 我要发布另一个问题,因为我已经在上一个问题中选择了一个答案,并且该问题现在已经改变了方向。 我正在使用python查询nvapi.dll以获取我的gpu使用值。 这是在C#中的操作方法(在下面引用): http://code.google.com/p/open-hardware-monitor/sour ..
发布时间:2020-10-12 22:54:48 Python

Ubuntu kworker线程消耗100%的CPU

我有一个问题,无法轻松找到答案。在我的Ubuntu安装中,一个kworker线程正在消耗100%的CPU,这有时会导致我的计算机运行非常缓慢或崩溃。 解决方案 编辑5: 最后,看来我的NVIDIA卡实际上无法正常工作。我把它寄回去,然后又得到了一个新的...:S 问题是新式风格的冲突(或其他问题)在我的车载视频卡和NVidia视频卡之间。在BIOS中,我禁用了板载卡,从而解决了 ..
发布时间:2020-10-10 23:43:28 其他开发

CMake检测到错误版本的OpenCL

在这篇文章之后,我在其中使用过这些说明,以安装NVIDIA的OpenCL SDK。 clinfo 工具可以正确检测到1.2 OpenCL版本。但是,下面的 CMakeLists.txt 文件: cmake_minimum_required(版本3.1 ) 项目(OpenCL_Example) find_package(需要OpenCL) include_directories( ..
发布时间:2020-10-03 18:57:22 其他开发

deviceQuery cuda程序示例

我有一台配置了NVIDIA GeForce1080 GTX和CentOS 7作为操作系统的Intel Xeon机器。我已经安装了NVIDIA驱动程序410.93和cuda-toolkit 10.0。编译cuda-samples之后,我尝试运行./deviceQuery。 但是它会这样抛出 ./ deviceQuery开始... CUDA设备查询(运行时API)版本(CUDART静 ..
发布时间:2020-09-30 19:38:04 其他开发