gpu 第39页 - IT屋-程序员软件开发技术分享社区

何时对共享CUDA内存使用volatile

在什么情况下，您应该使用 volatile 关键字与CUDA内核的共享内存？我知道 volatile 告诉编译器从不缓存任何值，但我的问题是关于共享数组的行为： __ shared__ float products [THREADS_PER_ACTION]; //一些计算 products [threadIdx.x] = localSum; //等待每个人完成他们的计算 ..

发布时间：2016-12-22 19:56:50 compiler-construction cuda gpu gpgpu volatile 其他开发

在gcc编译器上编译多个程序时是否可以使用GPU加速？

有没有任何方法或工具来应用GPU加速编译程序与GCC编译器？现在我创建了一个程序来迭代地编译给定的程序列表。这需要几分钟。我知道一些像Pyrit这样的程序，它有助于为预计算哈希应用GPU加速。如果没有这样的工具可用，请咨询是否使用OpenCL或任何否则重新编写我的代码。我们非常感谢您的帮助。谢谢。解决方案 A。在命令式编程语言中，并且每个语句可以改变程序的状态。因此， ..

发布时间：2016-12-22 19:24:40 gcc compiler-construction gpu hardware-acceleration 其他开发

不要自动切换到更高端的离散GPU

如本技术问答中所述：默认情况下，一旦你的应用程序创建一个OpenGL上下文（通过直接调用OpenGL或者一个依赖于OpenGL的API）作为核心动画，核心图像等），MacBook Pro自动切换到更高端的离散GPU的性能问题，将不会切换，直到应用程序退出。 p> 有一种方法可以防止这种情况发生？简单插入 NSSupportsAutomaticGraphicsSwitc ..

发布时间：2016-12-07 02:16:08 cocoa osx-lion gpu macbookpro info-plist 其它移动开发

最简单的方法来测试来自cmake的cuda功能的GPU的存在？

我们有一些夜间构建机器，安装了 cuda库，但是没有安装cuda功能的GPU。在我们的自动化夜间构建过程中，我们的cmake脚本使用cmake命令 find_package（CUDA）安装cuda软件。这将在安装了cuda软件的平台上设置cmake变量 CUDA_FOUND 。这是伟大的，它的作品完美。当设置 CUDA_FOUND 时，可以构建支持cuda的程序。即使机器没有 ..

发布时间：2016-12-02 23:16:40 build-automation cmake cuda gpu 其他开发

在Clojure的GPU编程？

我想知道如果有Clojure的GPU集成库存在？我看过这样的例子涉及手工滚动的OpenCL代码， m专门我正在寻找类似Anacoda加速，这将Numpy Python表达式转换为CUDA代码相对无缝。我开放给OpenCL或Cuda方法。解决方案有一个Google夏天代码项目建议添加一个GPU矩阵实现到 core.matrix ： http://dev.clojur ..

发布时间：2016-11-27 19:31:08 clojure cuda opencl gpu 其他开发语言

为什么cv :: gpu :: GaussianBlur比cv :: GaussianBlur慢？

我不是在C + +，OpenCV和CUDA的亲，不明白为什么 cv :: gpu :: warpPerspective（g_mask，g_frame，warp_matrix，g_frame.size（）， cv :: INTER_LINEAR，cv :: BORDER_CONSTANT，cv :: Scalar（255,255,255））; cv :: gpu :: Gaussian ..

发布时间：2016-11-03 00:09:43 c++ opencv cuda gpu C/C++开发

我想得到一个Gpu的名字在Windows操作系统与C + +

我想得到一个Gpu的名字，例如AMD Radeon HD4830，我想获得像“ATI Radeon HD4830”的信息。但是，我读取注册表，并获得像“ATI Radeon HD 4800系列”的信息。我使用D3D或OPCL的界面得到的信息也像“ATI Radeon HD 4800系列”一样。如何正确得到Gpu的名字？解决方案如果您在Windows中，可以使用 c ++ amp 试试： ..

发布时间：2016-10-30 21:48:51 c++ windows gpu C/C++开发

CUDA设备函数指针在结构中没有静态指针或符号复制

如果可能，我的预期程序流程将如下所示： typedef struct structure_t { [...] / *设备函数指针。 * / __device__ float（* function_pointer）（float，float，float []）; [...] }结构; [...] / *要分配的函数。 * / __device__ flo ..

发布时间：2016-10-30 15:47:34 c++ cuda gpu C/C++开发

GPU版本的OpenCV算法比我的机器上的CPU版本慢？

在尝试使用OpenCV GPU加速一个简单的算法时，我注意到在我的机器（Ubuntu 12.10，NVidia 9800GT，Cuda 4.2.9，g ++ 4.7.2）上，GPU版本实际上比CPU版本慢。我使用以下代码测试。 #include #include #include ..

发布时间：2016-10-30 03:18:47 c++ opencv cuda gpu C/C++开发

gpu :: morphologyEx比CPU中的morphologyEx慢？

我编写一个c ++代码，用于比较使用CPU和GPU版本的openCv的morphologyEx方法的性能。这是我的代码： #include #include #include #include using namespace cv; ..

发布时间：2016-10-30 02:03:56 c++ opencv cuda gpu mathematical-morphology C/C++开发

硬件加速图像缩放在Windows中使用C ++

我必须缩放位图图片（例如1280 x 720至1920 X 180，反之亦然）。我正在使用这个缩放功能，基于软件的扩展会消耗大量的CPU缩放和较慢的速度。有没有硬件加速的API或库来执行扩展？ href =“http://stackoverflow.com/questions/13691857/how-to-use-hardware-video-scalers?answert ..

发布时间：2016-10-30 01:39:03 c++ directx gpu video-capture mft C/C++开发

在OpenCV C ++中使用gpu :: GpuMat

我想知道如何修改 gpu :: GpuMat 。事实上，我想知道是否可以使用 gpu :: GpuMat 像 cv :: Mat 。我想这样做： cv :: namedWindow（“Result”）; cv :: Mat src_host = cv :: imread（“lena.jpg”，CV_LOAD_IMAGE_GRAYSCALE）; cv :: gpu :: Gp ..

发布时间：2016-10-30 00:56:12 c++ opencv image-processing cuda gpu C/C++开发

使用C ++提取GPU信息（希望WMI？）

我想知道如何使用C ++提取GPU。然而，我感兴趣的信息不是从Win32_VideoController类（ahh ..的可用的数据，墨菲的编程规则）。具体来说，我对（内存和着色器时钟）感兴趣。我想知道如何获得这些信息。我想避免DirectX查询，如果可能的话，由于我缺乏知识（实际上，零：P）。然而，如果这是最简单的方法，那么我愿意拍它。感谢解决方案我想你想使用 ..

发布时间：2016-10-25 16:05:48 c++ performance gpu clock C/C++开发

C ++中的元素操作

是否有一个预先存在的库，将允许我创建具有以下属性的数组类对象：运行时间大小规格重载执行元素操作的运算符（即 c = a + b 在中的 c 与 c [i] = a [i] + b [i] $ c> i ，同样 * ， - ， / c>等）一组很好的元素操作函数，例如 x = sqrt（vec）将有 x [i] = sqrt（vec [i]）提供“汇总” code> sum（ve ..

发布时间：2016-10-24 16:52:12 c++ arrays vector fortran gpu C/C++开发

以编程方式提取GPU利用率

有没有标准的方式获取GPU上的当前负载？我正在寻找类似于任务管理器显示CPU％。实用工具，如GPU-Z显示这个值，但我不知道如何得到这个。我目前特别感兴趣的是AMD显卡，任何指针都会有所帮助。如果没有干净的API方法，有没有任何程序的输出我可以捕获以获得这个信息？解决方案对于AMD / ATI卡，请查看GPU PerfStudio。 http://developer.amd.c ..

发布时间：2016-10-23 22:44:08 .net c++ gpu C#/.NET

矢量，代理类和点运算符在C + +

与C ++中的自定义Vector类相关的问题。 template ..

发布时间：2016-10-23 21:24:33 c++ vector gpu C/C++开发

在CUDA内核中使用虚拟函数

所以我想在设备上分配一个带有虚函数的对象，然后调用一个内核并执行一些虚函数。我尝试了两种方法，但两者都不工作： 1）使用cudaMalloc和cudaMemcpy从主机分配和复制对象。这会复制包含主机内存指针的虚拟函数表，这些指针在设备上执行时会明显崩溃内核。 2）从第二个内核分配对象，保存设备内存指针指向对象，并将该指针传递给原始内核。然而，由于内核不同，在内核执行时函数不在设备存储 ..

发布时间：2016-10-23 20:37:12 c++ cuda gpu virtual-functions C/C++开发

在CUDA内核中使用虚拟函数

所以我想在设备上分配一个带有虚函数的对象，然后调用一个内核并执行一些虚函数。我尝试了两种方法，但两者都不工作： 1）使用cudaMalloc和cudaMemcpy从主机分配和复制对象。这会复制包含主机内存指针的虚拟函数表，这些指针在设备上执行时会明显崩溃内核。 2）从第二个内核分配对象，保存设备内存指针指向对象，并将该指针传递给原始内核。然而，由于内核不同，在内核执行时函数不在设备存储 ..

发布时间：2016-10-23 20:18:11 c++ cuda gpu virtual-functions C/C++开发

CUDA imes生成

我的CUDA程序停止工作（它不打印任何东西），因为数据大小增加超过260k。有人可以告诉我为什么会发生这种情况吗？这是我第一个CUDA程序。如果我想要更大的素数，如何在CUDA上使用大于long long int的数据类型？图形卡是GT425M。＃include ＃include ＃include #def ..

发布时间：2016-10-23 12:33:40 c++ c cuda gpu primes C/C++开发

如何从C ++传递字符串矩阵到Cuda内核

问题：我有一个C ++中的字符串填充字符串，我想传递给cuda内核函数。我知道CUDA不能处理字符串，所以经过一些研究，我试过了一些解决方案如下所示。尝试：定义C ++中的指针数组，为每个单元格指定一个指针字符（为简单起见，tmp [i]被包含在前面引用的矩阵中的字符串填充） / p> C ++区 char * tmp [3]; int text_leng ..

发布时间：2016-10-21 00:07:44 c++ cuda gpu C/C++开发

gpu相关内容