gpu-shared-memory相关内容

GPU共享内存的大小非常小-我该怎么办?

在当今大多数nVIDIA GPU上,共享内存(OpenCL术语为“本地内存")的大小仅为16 KiB. 我有一个应用程序,需要在其中创建一个具有10,000个整数的数组.因此我需要容纳10,000个整数= 10,000 * 4b = 40kb的内存量. 我该如何解决? 是否有GPU拥有超过16 KiB的共享内存? 解决方案 将共享内存视为显式管理的缓存.您将需要将数组存储在全局内 ..
发布时间:2020-11-20 00:43:00 其他开发

OpenCL本地内存是否有限制?

今天,我在内核中添加了另外四个__local变量以转储中间结果.但是,仅将另外四个变量添加到内核的签名中并添加相应的Kernel参数会将内核的所有输出渲染为"0". cl函数均未返回错误代码. 我进一步尝试仅添加两个较小的变量之一.如果我仅添加其中一个,则可以使用,但是如果我同时添加它们,则将无法使用. 那么OpenCL的这种行为是否意味着我分配了很多__local内存?我如何找出我可 ..
发布时间:2020-05-20 18:51:52 其他开发