CUDA中的常量内存、纹理内存和全局内存 [英] Constant Memory vs Texture Memory vs Global Memory in CUDA
本文介绍了CUDA中的常量内存、纹理内存和全局内存的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在尝试找出CUDA中的常量内存、纹理内存和全局内存之间的区别。
我可以找到以下相关文章,但找不到我的问题的答案
global vs shared memory in CUDA
Usage of global vs. constant memory in CUDA
这篇文章讨论了这三种方法对性能的影响: http://forum.beyond3d.com/showthread.php?t=52510
推荐答案
常量内存:
这是存储常量和内核参数的位置
速度较慢,但带有缓存(8 KB)
常量内存针对广播进行了优化
纹理内存:
针对2D空间访问模式优化的缓存
读取具有地址模式和插补等优势,无需额外成本即可使用
全局内存:
慢速未缓存(1.0),已缓存(2.0)
(&A)要求顺序&;对齐的16字节读取和写入速度较快(合并读/写)
来源:http://www.cvg.ethz.ch/teaching/2011spring/gpgpu/cuda_memory.pdf
这篇关于CUDA中的常量内存、纹理内存和全局内存的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文