gpu相关内容

何时对共享CUDA内存使用volatile

在什么情况下,您应该使用 volatile 关键字与CUDA内核的共享内存?我知道 volatile 告诉编译器从不缓存任何值,但我的问题是关于共享数组的行为: __ shared__ float products [THREADS_PER_ACTION]; //一些计算 products [threadIdx.x] = localSum; //等待每个人完成他们的计算 ..
发布时间:2016-12-22 19:56:50 其他开发

在gcc编译器上编译多个程序时是否可以使用GPU加速?

有没有任何方法或工具来应用GPU加速编译程序与GCC编译器?现在我创建了一个程序来迭代地编译给定的程序列表。这需要几分钟。我知道一些像Pyrit这样的程序,它有助于为预计算哈希应用GPU加速。 如果没有这样的工具可用,请咨询是否使用OpenCL或任何否则重新编写我的代码。 我们非常感谢您的帮助。 谢谢。 解决方案 A。在命令式编程语言中,并且每个语句可以改变程序的状态。因此, ..
发布时间:2016-12-22 19:24:40 其他开发

不要自动切换到更高端的离散GPU

如本技术问答中所述:默认情况下,一旦你的应用程序创建一个OpenGL上下文(通过 直接调用OpenGL或者一个依赖于OpenGL的API)作为核心 动画,核心图像等),MacBook Pro自动切换到 更高端的离散GPU的性能问题,将不会切换 ,直到应用程序退出。 p> 有一种方法可以防止这种情况发生? 简单插入 NSSupportsAutomaticGraphicsSwitc ..
发布时间:2016-12-07 02:16:08 其它移动开发

最简单的方法来测试来自cmake的cuda功能的GPU的存在?

我们有一些夜间构建机器,安装了 cuda库,但是没有安装cuda功能的GPU。 在我们的自动化夜间构建过程中,我们的cmake脚本使用cmake命令 find_package(CUDA) 安装cuda软件。这将在安装了cuda软件的平台上设置cmake变量 CUDA_FOUND 。这是伟大的,它的作品完美。当设置 CUDA_FOUND 时,可以构建支持cuda的程序。即使机器没有 ..
发布时间:2016-12-02 23:16:40 其他开发

在Clojure的GPU编程?

我想知道如果有Clojure的GPU集成库存在? 我看过这样的例子涉及手工滚动的OpenCL代码, m专门我正在寻找类似Anacoda加速,这将Numpy Python表达式转换为CUDA代码相对无缝。 我开放给OpenCL或Cuda方法。 解决方案 有一个Google夏天代码项目建议添加一个GPU矩阵实现到 core.matrix : http://dev.clojur ..
发布时间:2016-11-27 19:31:08 其他开发语言

我想得到一个Gpu的名字在Windows操作系统与C + +

我想得到一个Gpu的名字,例如AMD Radeon HD4830,我想获得像“ATI Radeon HD4830”的信息。但是,我读取注册表,并获得像“ATI Radeon HD 4800系列”的信息。我使用D3D或OPCL的界面得到的信息也像“ATI Radeon HD 4800系列”一样。如何正确得到Gpu的名字? 解决方案 如果您在Windows中,可以使用 c ++ amp 试试: ..
发布时间:2016-10-30 21:48:51 C/C++开发

硬件加速图像缩放在Windows中使用C ++

我必须缩放位图图片(例如1280 x 720至1920 X 180,反之亦然)。 我正在使用这个缩放功能,基于软件的扩展会消耗大量的CPU缩放和较慢的速度。 有没有硬件加速的API或库来执行扩展? href =“http://stackoverflow.com/questions/13691857/how-to-use-hardware-video-scalers?answert ..
发布时间:2016-10-30 01:39:03 C/C++开发

在OpenCV C ++中使用gpu :: GpuMat

我想知道如何修改 gpu :: GpuMat 。事实上,我想知道是否可以使用 gpu :: GpuMat 像 cv :: Mat 。 我想这样做: cv :: namedWindow(“Result”); cv :: Mat src_host = cv :: imread(“lena.jpg”,CV_LOAD_IMAGE_GRAYSCALE); cv :: gpu :: Gp ..
发布时间:2016-10-30 00:56:12 C/C++开发

使用C ++提取GPU信息(希望WMI?)

我想知道如何使用C ++提取GPU。然而,我感兴趣的信息不是从Win32_VideoController类(ahh ..的可用的数据,墨菲的编程规则)。具体来说,我对(内存和着色器时钟)感兴趣。 我想知道如何获得这些信息。 我想避免DirectX查询,如果可能的话,由于我缺乏知识(实际上,零:P)。然而,如果这是最简单的方法,那么我愿意拍它。 感谢 解决方案 我想你想使用 ..
发布时间:2016-10-25 16:05:48 C/C++开发

C ++中的元素操作

是否有一个预先存在的库,将允许我创建具有以下属性的数组类对象: 运行时间大小规格 重载执行元素操作的运算符(即 c = a + b 在中的 c 与 c [i] = a [i] + b [i] $ c> i ,同样 * , - , / c>等) 一组很好的元素操作函数,例如 x = sqrt(vec)将有 x [i] = sqrt(vec [i]) 提供“汇总” code> sum(ve ..
发布时间:2016-10-24 16:52:12 C/C++开发

以编程方式提取GPU利用率

有没有标准的方式获取GPU上的当前负载?我正在寻找类似于任务管理器显示CPU%。实用工具,如GPU-Z显示这个值,但我不知道如何得到这个。我目前特别感兴趣的是AMD显卡,任何指针都会有所帮助。 如果没有干净的API方法,有没有任何程序的输出我可以捕获以获得这个信息? 解决方案 对于AMD / ATI卡,请查看GPU PerfStudio。 http://developer.amd.c ..
发布时间:2016-10-23 22:44:08 C#/.NET

在CUDA内核中使用虚拟函数

所以我想在设备上分配一个带有虚函数的对象,然后调用一个内核并执行一些虚函数。我尝试了两种方法,但两者都不工作: 1)使用cudaMalloc和cudaMemcpy从主机分配和复制对象。这会复制包含主机内存指针的虚拟函数表,这些指针在设备上执行时会明显崩溃内核。 2)从第二个内核分配对象,保存设备内存指针指向对象,并将该指针传递给原始内核。然而,由于内核不同,在内核执行时函数不在设备存储 ..
发布时间:2016-10-23 20:37:12 C/C++开发

在CUDA内核中使用虚拟函数

所以我想在设备上分配一个带有虚函数的对象,然后调用一个内核并执行一些虚函数。我尝试了两种方法,但两者都不工作: 1)使用cudaMalloc和cudaMemcpy从主机分配和复制对象。这会复制包含主机内存指针的虚拟函数表,这些指针在设备上执行时会明显崩溃内核。 2)从第二个内核分配对象,保存设备内存指针指向对象,并将该指针传递给原始内核。然而,由于内核不同,在内核执行时函数不在设备存储 ..
发布时间:2016-10-23 20:18:11 C/C++开发

CUDA imes生成

我的CUDA程序停止工作(它不打印任何东西),因为数据大小增加超过260k。 有人可以告诉我为什么会发生这种情况吗?这是我第一个CUDA程序。如果我想要更大的素数,如何在CUDA上使用大于long long int的数据类型? 图形卡是GT425M。 #include #include #include #def ..
发布时间:2016-10-23 12:33:40 C/C++开发

如何从C ++传递字符串矩阵到Cuda内核

问题: 我有一个C ++中的字符串填充字符串,我想传递给cuda内核函数。我知道CUDA不能处理字符串,所以经过一些研究,我试过了一些解决方案如下所示。 尝试: 定义C ++中的指针数组,为每个单元格指定一个指针字符(为简单起见,tmp [i]被包含在前面引用的矩阵中的字符串填充) / p> C ++区 char * tmp [3]; int text_leng ..
发布时间:2016-10-21 00:07:44 C/C++开发