gpgpu相关内容

CUDA 3.2中的多个GPU以及Cuda 4.0的问题

我是多个GPU的新手.我已经为单个GPU编写了代码,并希望通过使用多个GPU进一步提高速度.我正在使用两个GTX 470,MS VS 2008和cuda工具包4.0 我面临两个问题. 第一个问题是我的代码无法在4.0构建规则下正常运行,而在3.2构建规则下正常运行.同样,multiGPU的SDK示例也不基于VS2008给出错误 错误C3861:'cudaDeviceReset': ..
发布时间:2020-07-01 02:30:37 其他开发

Lasagne Dropoutlayer无法有效利用GPU

我正在将theano和烤宽面条用于DNN语音增强项目.我使用的前馈网络与lasagne文档(/github.com/Lasagne/Lasagne/blob/master/examples/mnist.py)中的mnist示例非常相似.该网络使用多个辍学层.我在Nvidia Titan X GPU上训练网络.但是,当我不使用中断时,我的GPU利用率大约为60%,一个时期大约需要60秒,但是当我使用 ..
发布时间:2020-06-29 19:30:45 Python

C ++ AMP的当前状态是什么

我正在使用C ++编写高性能代码,并且一直在使用CUDA和OpenCL以及最近使用的C ++ AMP,这是我非常喜欢的。但是,我有点担心它不会被开发和扩展,并且会消失。 导致我想到这个想法的是,即使是MS C ++ AMP博客沉默了大约一年。查看C ++ AMP算法库 http://ampalgorithms.codeplex.com/wikipage/history 我看到的唯一发展 ..
发布时间:2020-06-07 19:00:59 C/C++开发

并发内核启动示例-CUDA

我正在尝试为非常复杂的CUDA内核实现并发内核启动,因此我认为我将从一个简单的示例开始.它只是启动一个减少总和的内核.很简单.在这里: #include #include #include #include extern __shared__ char dsmem[]; __device__ double *sc ..
发布时间:2020-05-24 21:50:33 其他开发

改善并行计算的内存布局

我正在尝试针对使用C ++ AMP的并行计算优化算法(Lattice Boltzmann).在寻找优化内存布局的建议时,发现将结构中的一个参数删除到另一个向量(阻塞向量)中可以增加约10%. 任何人都有可以进一步改善这一点的提示,还是我应该考虑的一些提示? 下面是每个时间步执行的最耗时的功能,以及用于布局的结构. struct grid_cell { // int blocked; ..
发布时间:2020-05-24 21:05:08 C/C++开发

OpenGL ES 2.0顶点着色器纹理无法从FBO读取吗?

我目前正在研究使用OpenGL ES 2.0的GPGPU项目.我有一个使用帧缓冲对象(FBO)作为目标的渲染管道,即每次渲染过程的结果都保存在附加到FBO的纹理中.到目前为止,这在使用片段着色器时有效.例如,我必须遵循以下渲染管道: Preprocessing (downscaling, grayscale conversion) -> Adaptive Thresholding Pass ..
发布时间:2020-05-21 00:37:34 其他开发

Opengl Es如何用于gpgpu实现

我想将Opengl Es用于图像处理代码的gpgpu实现.我想知道我是否可以为此目的使用Opengl Es.如果可以的话,那么哪个版本的Opengl Es更适合于此目的(Opengl Es 1.1或2.0). 解决方案 OpenGL ES是一种用于嵌入式系统的图形技术,因此功能不如它的大兄弟那么强大. OpenGL ES的设计初衷并不是要进行gpgpu处理,但是可以实现某些算法,尤其是那些 ..
发布时间:2020-05-21 00:23:09 其他开发

在GPU上计算积分图像真的比在CPU上更快吗?

我是GPU计算的新手,所以这可能是一个非常幼稚的问题. 我进行了一些查找,似乎在GPU上计算积分图像是一个不错的主意. 但是,当我真正深入研究它时,我想知道它可能不会比CPU快,特别是对于大图像.因此,我只想了解您对此的想法,以及一些有关GPU是否真的更快的解释. 因此,假设我们有一个MxN图像,则积分图像的CPU计算将需要大约3xMxN的加法,即O(MxN). 在GPU上,按照"Op ..
发布时间:2020-05-20 23:27:21 C/C++开发

文本和矢量艺术的快速栅格化

假设向量中有很多形状(确定形状边界的贝塞尔曲线).例如,一个充满小字母的页面. 从中创建位图的最快方法是什么? 几年前,我曾经看过一个演示(现在找不到),其中一些人使用GPU光栅化矢量艺术-他们能够实时放大/缩小页面. Bezier形状的GPU渲染的当前状态是什么?真的快吗?比CPU快?有哪些常见且不太常见的算法?是否有用于此类事情的开源库?它使用什么语言? OpenGL呢? 解 ..
发布时间:2020-05-20 23:16:35 其他开发

OpenGL 4.0 GPU绘图功能?

在Wikipedia和其他来源对OpenGL 4.0的描述中,我了解了此功能: 在没有CPU干预的情况下,绘制由OpenGL或OpenAPI等外部API生成的数据. 这是什么意思? 修改: 似乎必须引用Draw_Indirect,我 相信 ,以某种方式扩展绘制阶段,以包含着色器程序或互操作程序的反馈(基本上是OpenCL/CUDA) 在第二次运行之后,似乎有一些警告和技巧可 ..
发布时间:2020-05-20 23:08:23 其他开发

带有Vertex/Pixel着色器的通用计算(Open GL/DirectX)

我对计算着色器有疑问. DX 9中是否提供计算着色器?如果GPU上没有计算着色器片段,是否仍可以将计算着色器与DX9驱动程序一起使用? (据IMG所说,SGX 545没有它,但是SGX 6X一代将拥有它).我想知道我是否可以使用DirectX9或OpenGL驱动程序在SGX GPU上进行一些简单的通用编程. 此外,无论如何,我可以使用OpenGL顶点着色器进行GPGPU编程吗?这是我在想什么 ..
发布时间:2020-05-20 22:37:14 其他开发

在GLSL片段着色器中,如何在特定的mipmap级别访问texel?

我正在使用OpenGL通过一个顶点着色器和一个片段着色器的组合进行一些GPGPU计算.我需要对图像进行不同比例的计算.我想使用mipmap,因为它们的生成可以是自动的并且可以通过硬件加速.但是我无法访问片段着色器中的mipmap纹理. 我启用了自动生成Mipmap的功能: glTexParameteri(GL_TEXTURE_2D,GL_GENERATE_MIPMAP,GL_TRUE); ..
发布时间:2020-05-20 22:12:22 其他开发

访问/同步到本地内存

我对GPGPU编程还很陌生.我正在尝试实现需要大量同步的算法,因此它仅使用一个工作组(全局和本地大小具有相同的值) 我有一个休闲问题:我的程序可以正常运行,直到问题大小超过32. __kernel void assort( __global float *array, __local float *currentOutput, __local float *stimulations, ..
发布时间:2020-05-20 19:03:37 其他开发

OpenCl:最低配置可与AMD GPU配合使用

假设我们拥有AMD GPU(例如Radeon HD 7970)和没有X等的最小Linux系统. 要具有适当的OpenCL环境,应该安装什么,应该启动什么以及如何启动它?最好是在没有头的环境中. 环境要求 OpenCL程序可见的GPU(例如clinfo) 可以监视温度并设置风扇速度(例如,使用aticonfig). P.S.简单安装Xserver,催化剂并运行X :0将无法 ..
发布时间:2020-05-20 19:02:24 其他开发