pyopencl相关内容

无论如何要在带有 AMD GPU 的 Mac 中使用 Keras?

我有一台配备 AMD 处理器的 MacBook Pro,我想在这个 GPU 中运行 Keras(Tensorflow 后端).我开始知道 Keras 只适用于 NVIDIA GPU.解决方法是什么(如果可能)? 解决方案 您可以OpenCL 库来克服这个问题.我已经对其进行了测试,它对我来说运行良好. 注意:我有 python 3.7 版,我将使用 pip3 安装包. 步骤: ..
发布时间:2021-12-19 12:28:00 其他开发

PyOpenCL“致命错误:CL/cl.h:没有这样的文件或目录"在 Windows 8 (x64) 中安装时出错

在大量搜索此问题的解决方案后,我发现此特定错误尚未针对 Windows 正确记录.所以我决定将这个问题与解决方案一起发布.对不起,如果我在错误的部分发布了这个.我希望这个解决方案能帮助用户在未来解决 PyOpenCL 安装错误.请注意,此处使用的示例适用于支持 AMD OpenCL SDK SDK 的 ATI Radeon GPU.对于其他GPU,请参考各自的参数并根据需要实现.如果安装失败,也不 ..
发布时间:2021-06-12 19:32:02 Python

PyOpenCL:如何创建本地内存缓冲区?

这里可能是非常简单的问题,但我已经搜索了几个小时却没有任何内容. 我有这段代码,我想要一个 256 位(8 uint32)bitstring_gpu 作为设备中的本地内存指针: def Get_Bitstring_GPU_Buffer(ctx, bitstring):bitstring_gpu = cl.Buffer(ctx, mem_flags.READ_ONLY | mem_flags ..
发布时间:2021-06-12 19:31:55 其他开发

来自numpy数组的PyopenCL 3D RGBA图像

我想使用pyopencl从一个numpy数组构造一个OpenCL 3D RGBA图像.我知道 cl.image_from_array()函数,基本上可以做到这一点,但是并没有提供对由 cl.enqueue_copy().因此,我真的很想使用后者的功能,将3D RGBA图像从主机传输到设备,但是我似乎无法正确获取图像构造函数的语法. 所以在这种环境下 将pyopencl导入为cl将numpy ..
发布时间:2021-05-15 20:18:16 Python

pyopenCL,openCL,无法在GPU上构建程序

我有一个内核源代码,可以在PC上的G970上运行,但是无法在具有Iris 6100 1536MB图形的2015年初的MacBook Pro上编译. platform = cl.get_platforms()[0]device = platform.get_devices()[1]#获取GPU IDctx = cl.Context([device])#告诉CL使用GPUqueue = cl.Co ..
发布时间:2021-05-13 18:42:39 Python

在PyCUDA上共享内存入门

我正在尝试通过玩以下代码来了解共享内存: 将pycuda.driver导入为drv导入pycuda.tools导入pycuda.autoinit导入numpy从pycuda.compiler导入SourceModulesrc ='''__global__ void reduce0(float * g_idata,float * g_odata){extern __shared__ float s ..
发布时间:2021-04-27 20:10:32 Python

在PyOpenCL中测量时间

我正在FPGA和GPU中使用PyOpenCL运行内核.为了衡量执行时间,我使用: t1 = time() event = mykernel(queue, (c_width, c_height), (block_size, block_size), d_c_buf, d_a_buf, d_b_buf, a_width, b_width) event.wait() t2 = time() co ..
发布时间:2020-11-10 19:27:44 其他开发

创建PyOpenCl上下文会导致以后的访问冲突

我刚刚开始使用pyopencl尝试OpenCL.我是从这里得到的 http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyopencl 我编写了一些测试程序,执行工作按预期进行.比起我想开始进行大量仿真时,我因访问冲突而随机崩溃(Windows错误代码FFFFFFFFC0000005).事实证明,导入pyopencl并创建上下文的任何脚本在一到两分钟后 ..
发布时间:2020-07-04 21:21:14 其他开发

严重错误C1083:无法打开包含文件:'CL/cl.h'

我阅读了本网站上提供的所有解决方案以解决此问题,但是仍然存在. 当我在Windows 10 C:\pyopencl-2016.2.1>setup.py install的cmd中运行此命令时,将显示此错误: c:\pyopencl-2016.2.1\src\c_wrapper\clinfo_ext.h(10) : fatal error C1083: Cannot open include ..
发布时间:2020-07-04 21:19:58 其他开发

结合使用GPU分析器(例如CodeXL)和PyOpenCL

我有一个复杂的PyOpenCL应用程序,其中包含许多缓冲区创建,内核模板等.我想在GPU上对我的应用程序进行配置,以查看我的情况的瓶颈所在. 是否可以在PyOpenCl应用程序中使用某些gpu分析器?例如CodeXL. P.S.我知道事件分析,但还不够. 解决方案 是的,有可能.在这里查看: http://devgurus.amd.com/message/1282742 ..
发布时间:2020-07-04 19:05:33 其他开发

使用PyOpenCL进行结构对齐

更新:内核中的int4错误. 我正在使用pyopencl,但是无法使结构对齐正常工作.在下面的代码(两次调用内核)中,正确返回了b值(为1),但是c值具有一些“随机"值. 换句话说: 我正在尝试读取结构的两个成员.我可以阅读第一个,但不能阅读第二个.为什么? 无论我使用numpy结构化数组还是使用struct打包,都会发生相同的问题.而且注释中的_-attribute__设置也无 ..
发布时间:2020-05-20 19:02:41 Python

PyOpenCL第一次运行时返回错误,然后仅返回“无效程序"错误;例子也行不通

我正在尝试使用pyOpenCL绑定运行OpenCL内核,以便在GPU上运行.我试图将内核加载到程序中.我运行了一次程序,但出现错误.我不更改代码再次运行,并收到了另一个“无效程序"错误. 在使用pyOpenCL的我自己的程序以及示例程序中,这种情况一直在发生.我可以在CPU和GPU上通过C++绑定使用OpenCL,没有问题.所以我认为这是pyOpenCL绑定特有的问题. 我的操作系统是 ..
发布时间:2020-05-20 19:00:56 Python

尽管存在障碍,开放式CL也无法同步

我刚刚开始通过Python的PyOpenCL接口使用OpenCL.我试图创建一个非常简单的“循环"程序,其中每个内核中每个循环的结果都取决于上一个循环中另一个内核的输出,但是我遇到了同步问题: __kernel void part1(__global float* a, __global float* c) { unsigned int i = get_global_id(0); ..
发布时间:2020-05-20 18:59:28 其他开发

local_work_size对性能的影响及其原因

大家好...... 我是opencl的新手,正在尝试探索更多@@ openCL程序中local_work_size的工作是什么,以及它对性能的影响. 我正在研究一些图像处理算法,并且为我提供的openCL内核 size_t local_item_size = 1; size_t global_item_size = (int) (ceil((float)(D_can_widt ..
发布时间:2020-05-20 18:57:10 其他开发

PyOpenCL矩阵乘法

我有使用pyopenCL进行矩阵乘法的代码. 我的问题是在某些矩阵中结果是错误的,我不明白为什么. 经过一些研究,我认为它与类似的全局大小有关,但我不知道如何设置该值. 例如: 使用numpy dtype = float32的矩阵 矩阵1: [[ 0.99114645 0.09327769 0.90075564 0.8913309 ] [ 0.59739089 0. ..
发布时间:2020-05-20 18:54:56 Python

有没有一种方法可以分析OpenCL或pyOpenCL程序?

我正在尝试优化pyOpenCL程序.出于这个原因,我想知道是否有一种方法可以对程序进行概要分析,并了解大部分时间在哪里. 您知道如何解决此问题吗? 预先感谢 安迪 编辑:例如,用于CUDA的nvidias nvprof可以解决pyCuda的问题,但不能解决pyOpenCL. 解决方案 好的, 我想出了一种方法:Cuda Toolkit 3.1提供了针对openCL的配 ..
发布时间:2020-05-20 18:54:08 Python