CUDA中的常量内存、纹理内存和全局内存 [英] Constant Memory vs Texture Memory vs Global Memory in CUDA

查看:4
本文介绍了CUDA中的常量内存、纹理内存和全局内存的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试找出CUDA中的常量内存、纹理内存和全局内存之间的区别。

我可以找到以下相关文章,但找不到我的问题的答案

global vs shared memory in CUDA

Usage of global vs. constant memory in CUDA

这篇文章讨论了这三种方法对性能的影响: http://forum.beyond3d.com/showthread.php?t=52510

推荐答案

常量内存:

这是存储常量和内核参数的位置

速度较慢,但带有缓存(8 KB)

常量内存针对广播进行了优化

纹理内存:

针对2D空间访问模式优化的缓存

读取具有地址模式和插补等优势,无需额外成本即可使用

全局内存:

慢速未缓存(1.0),已缓存(2.0)

(&A)

要求顺序&;对齐的16字节读取和写入速度较快(合并读/写)

来源:http://www.cvg.ethz.ch/teaching/2011spring/gpgpu/cuda_memory.pdf

这篇关于CUDA中的常量内存、纹理内存和全局内存的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆