nvidia 第10页 - IT屋-程序员软件开发技术分享社区

我们不能对CUDA中的浮点变量使用原子操作吗？

我已经使用 atomicMax（）在CUDA内核中找到最大值： __ global__ void global_max（float *值，float * gl_max） { int i = threadIdx.x + blockDim.x * blockIdx.x; float val = values [i]; atomicMax（gl_max，val）; } ..

发布时间：2020-10-13 00:59:47 cuda nvidia 其他开发

P2P复制的cudaMemcpy（）和cudaMemcpyPeer（）之间有什么区别？

我想直接在不使用CPU-RAM的情况下将数据从GPU0-DDR复制到GPU1-DDR。如第15页上所述： http://people.maths.ox.ac.uk/gilesm/cuda/MultiGPU_Programming.pdf 对等Memcpy 从GPU A上的指针直接复制到GPU上的指针B 对于UVA，只需使用cudaMemcpy（…，cudaMemcpyDe ..

发布时间：2020-10-13 00:56:56 cuda gpgpu nvidia 其他开发

Tensorflow无法打开libcuda.so.1

我有一台配备GeForce 940 MX的笔记本电脑。我想启动Tensorflow并在gpu上运行。我从他们的教程页面安装了所有内容，现在当我导入Tensorflow时，我得到了 >>导入tensorflow为tf 我tensorflow / stream_executor / dso_loader.cc：128]在本地成功打开CUDA库libcublas.so 我tensorflow ..

发布时间：2020-10-13 00:55:45 cuda tensorflow nvidia 其他开发

NVIDIA NVML驱动程序/库版本不匹配

当我运行 nvidia-smi 时，我收到以下消息：初始化NVML失败：驱动程序/库版本不匹配一个小时前，我收到了相同的消息，并且卸载了我的cuda库，我得以运行 nvidia-smi ，得到以下结果：此后，我下载了 cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61- 1_amd64.deb 从 NVIDI ..

发布时间：2020-10-13 00:52:32 cuda driver gpu nvidia 其他开发

练习计算CUDA的网格大小

dim3块（4，2） dim3网格（（nx + block.x-1）/block.x，（ny.block.y-1）/ block.y）; 我在第53页的Professional CUDA C编程中找到了此代码。这只是一个简单的例子矩阵乘法。 nx 是列数， ny 是行数。您能解释一下如何计算网格大小吗？为什么将 block.x 添加到 nx 然后减去 1 ？ ..

发布时间：2020-10-13 00:50:06 cuda nvidia 其他开发

如何找到活跃的SM？

是否可以通过任何方式了解空闲/活动SM的数量？还是至少要读取每个SM的电压/功率或温度值，才能知道其是否正常工作？（在gpu设备上执行某些作业时实时）。％smid帮助我了解了每个SM的ID。感谢和问候， Rakesh 解决方案 CUDA分析工具接口（ CUPTI ）包含事件API可以对GPU PM计数器进行运行时采样。 CUPTI SDK随CUDA Toolkit一起提 ..

发布时间：2020-10-13 00:47:32 cuda gpgpu nvidia ptx 其他开发

nVIDIA驱动程序如何将设备索引分配给GPU？

假设在单个节点上，有几个具有不同计算功能的设备，nvidia如何对其排序（按级别，我是指cudaSetDevice分配的数字）？是关于此有任何一般性准则吗？谢谢。解决方案我相信与 cudaGetDevice 和 cudaSetDevice （即CUDA运行时枚举顺序应基于启发式方法，该方法确定最快的设备并使其成为第一个，或者基于 PCI枚举顺序。您可以使用 deviceQuer ..

发布时间：2020-10-13 00:45:45 cuda nvidia 其他开发

在哪个设备上创建流与在哪个设备上执行代码之间是否存在关系？

如果我使用此代码，那么它将在设备0或1上执行吗？ cudaSetDevice（0）; //切换到设备0 cudaStream_t stream1; cudaStreamCreate（& stream1）; //在设备0 cudaSetDevice（1）上创建； //切换到设备1 kernel_function>>>（）; //在设 ..

发布时间：2020-10-13 00:44:55 cuda gpgpu nvidia 其他开发

nvprof命令错误：找不到cupti64_102.dll

当我尝试在命令提示符下运行 nvprof 命令时，系统弹出Erros并说：“由于无法找到cupti64_102.dll，代码执行无法继续。重新安装程序可能会解决此问题。“ 我已安装CUDA Toolkit 10.2，但 cupti64_102.dll 不在 / bin 。系统：Windows 10，Quadro K4200，CUDA10.2，CUDA Toolkit 10.2 ..

发布时间：2020-10-13 00:44:48 cuda nvidia nvcc nvprof 其他开发

如何理解“ warp中的所有线程同时执行相同的指令”。在GPU中？

我正在阅读专业CUDA C编程，然后在 GPU体系结构概述部分： CUDA采用单指令多线程（SIMT）架构来管理和以32个称为warp的组执行线程。线程束中的所有线程同时执行同一条指令。每个线程都有其自己的指令地址计数器和寄存器状态，并根据自己的数据执行当前指令。每个SM将分配给它的线程块划分为32个线程扭曲，然后调度在可用硬件资源上执行。 SIMT体系结构类似于SIMD（单指令，多数 ..

发布时间：2020-10-13 00:43:25 cuda gpu nvidia gpu-programming multiple-gpu 其他开发

在一个GPU上运行多个CUDA应用程序

CUDA文档没有具体说明可以共享一个GPU的CUDA进程数。例如，如果我由同一用户在系统中仅安装了一张GPU卡的情况下启动了多个CUDA程序，那会有什么效果？会保证执行的正确性吗？在这种情况下，GPU如何安排任务？解决方案来自独立主机进程的CUDA活动通常会创建独立的CUDA 上下文，每个过程一个。因此，从单独的主机进程启动的CUDA活动将在同一设备上的单独CUDA上下文中进行。 ..

发布时间：2020-10-13 00:39:33 cuda gpu gpgpu nvidia 其他开发

如何选择要在哪个GPU上运行作业？

在多GPU计算机中，如何指定CUDA作业应在哪个GPU上运行？例如，在安装CUDA时，我选择安装 NVIDIA_CUDA- _Samples 然后运行 nbody 模拟的几个实例，但是它们都在一个GPU 0上运行； GPU 1完全闲置（使用 watch -n 1 nvidia-dmi 进行监视）。使用 echo $ CUDA_VISIBLE_DEVICES 检查 CU ..

发布时间：2020-10-13 00:39:05 cuda nvidia 其他开发

CUDA GPU是按位置选择的，但是如何将default设置为设备0以外的值？

我最近在家中的机器上安装了第二个GPU（Tesla K40），我的搜索建议第一个PCI插槽成为为CUDA作业选择的默认GPU。一个很棒的链接正在解释它，可以在这里找到：默认GPU分配我原来的GPU是TITAN X，也启用了CUDA，但实际上最适合单个精度计算，特斯拉更好地实现了双精度。对于该小组，我的问题是是否有办法将我的默认CUDA编程设备始终设置为第二个？显然，我每次都可以在代 ..

发布时间：2020-10-13 00:37:27 cuda nvidia gpu-programming 其他开发

如何在CUDA中以编程方式获取卡规格

我刚开始使用CUDA。有没有办法以编程方式获取卡的规格？解决方案您可以使用 cudaGetDeviceCount 和 cudaGetDeviceProperties API。 void DisplayHeader（） { const int kb = 1024; const int mb = kb * kb; wcout ..

发布时间：2020-10-13 00:37:00 cuda nvidia specs 其他开发

为什么我们需要cudaDeviceSynchronize（）;在带有device-printf的内核中？

__ global__ void helloCUDA（float f） { printf（“ Hello thread％d，f =％f\n”，threadIdx.x，f ）; } int main（） { helloCUDA >（1.2345f）; cudaDeviceSynchronize（）; 返回0； } 为什么cudaDeviceSynchro ..

发布时间：2020-10-13 00:35:54 c cuda gpu nvidia 其他开发

如何使tensorflow在具有2.x功能的GPU上运行？

我已经在Linux Ubuntu 16.04上成功安装了tensorflow（GPU），并进行了一些小改动，以便使其能够与新的Ubuntu LTS版本一起使用。但是，我以为（谁知道为什么）我的GPU满足了计算能力大于3.5的最低要求。情况并非如此，因为我的 GeForce 820M 只有2.1。我可以问这个问题，因为显然没有办法在Ubuntu 16.04上运行tensorflow GPU版 ..

发布时间：2020-10-13 00:33:01 cuda tensorflow nvidia cudnn 其他开发

使用python ctypes与nvapi交互（跟随演示代码）

这是我先前的问题的后续解答：有关python ctypes和nvapi的帮助我要发布另一个问题，因为我已经在上一个问题中选择了一个答案，并且该问题现在已经改变了方向。我正在使用python查询nvapi.dll以获取我的gpu使用值。这是在C＃中的操作方法（在下面引用）： http://code.google.com/p/open-hardware-monitor/sour ..

发布时间：2020-10-12 22:54:48 python ctypes nvidia Python

Ubuntu kworker线程消耗100％的CPU

我有一个问题，无法轻松找到答案。在我的Ubuntu安装中，一个kworker线程正在消耗100％的CPU，这有时会导致我的计算机运行非常缓慢或崩溃。解决方案编辑5：最后，看来我的NVIDIA卡实际上无法正常工作。我把它寄回去，然后又得到了一个新的...：S 问题是新式风格的冲突（或其他问题）在我的车载视频卡和NVidia视频卡之间。在BIOS中，我禁用了板载卡，从而解决了 ..

发布时间：2020-10-10 23:43:28 ubuntu cpu nvidia 其他开发

CMake检测到错误版本的OpenCL

在这篇文章之后，我在其中使用过这些说明，以安装NVIDIA的OpenCL SDK。 clinfo 工具可以正确检测到1.2 OpenCL版本。但是，下面的 CMakeLists.txt 文件： cmake_minimum_required（版本3.1 ）项目（OpenCL_Example） find_package（需要OpenCL） include_directories（ ..

发布时间：2020-10-03 18:57:22 c windows cmake opencl nvidia 其他开发

deviceQuery cuda程序示例

我有一台配置了NVIDIA GeForce1080 GTX和CentOS 7作为操作系统的Intel Xeon机器。我已经安装了NVIDIA驱动程序410.93和cuda-toolkit 10.0。编译cuda-samples之后，我尝试运行./deviceQuery。但是它会这样抛出 ./ deviceQuery开始... CUDA设备查询（运行时API）版本（CUDART静 ..

发布时间：2020-09-30 19:38:04 cuda centos nvidia 其他开发

nvidia相关内容