gpu-shared-memory - IT屋-程序员软件开发技术分享社区

GPU共享内存的大小非常小-我该怎么办?

在当今大多数nVIDIA GPU上，共享内存(OpenCL术语为“本地内存")的大小仅为16 KiB. 我有一个应用程序，需要在其中创建一个具有10,000个整数的数组.因此我需要容纳10,000个整数= 10,000 * 4b = 40kb的内存量. 我该如何解决? 是否有GPU拥有超过16 KiB的共享内存? 解决方案将共享内存视为显式管理的缓存.您将需要将数组存储在全局内 ..

发布时间：2020-11-20 00:43:00 gpu nvidia gpu-shared-memory 其他开发

解释ptxas的详细输出，第二部分

该问题是继续解释ptxas的详细输出，第一部分。。当我们使用 ptxas -v 编译内核 .ptx 文件时，或从一个具有 -ptxas-options = -v 的 .cu 文件，我们得到如下几行输出： / p> ptxas info：编译输入函数'searchkernel（octree，int *，double，int，double *，double *，double *） 'f ..

发布时间：2020-10-13 01:29:06 cuda verbose gpu-shared-memory gpu-constant-memory ptxas 其他开发

OpenCL本地内存是否有限制?

今天，我在内核中添加了另外四个__local变量以转储中间结果.但是，仅将另外四个变量添加到内核的签名中并添加相应的Kernel参数会将内核的所有输出渲染为"0". cl函数均未返回错误代码. 我进一步尝试仅添加两个较小的变量之一.如果我仅添加其中一个，则可以使用，但是如果我同时添加它们，则将无法使用. 那么OpenCL的这种行为是否意味着我分配了很多__local内存?我如何找出我可 ..

发布时间：2020-05-20 18:51:52 opencl gpgpu gpu-shared-memory 其他开发

使用动态分配和静态分配的共享内存

假设我有两个 __ device __ CUDA函数，每个都有以下局部变量： code> __ shared__ int a [123]; 和另一个函数（说这是我的内核，即 __ global __ function），具有： extern __shared__ int b []; 这是明确允许/禁止nVIDIA吗？（我在编程指南 __共享_ ..

发布时间：2017-03-04 13:12:14 cuda gpu-shared-memory 其它硬件开发

gpu-shared-memory相关内容