CUDA:并发的,独特的内核在同一个多处理器? [英] CUDA: Concurrent, Unique Kernels on the Same Multiprocessor?

查看:190
本文介绍了CUDA:并发的,独特的内核在同一个多处理器?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

有可能使用流在Kepler 3.5 GPU的同一流多处理器上拥有多个独特的内核吗?在具有15个SM的Kepler GPU上同时运行30个大小小于<1 <1024 >>的内核?

Is it possible, using streams, to have multiple unique kernels on the same streaming multiprocessor in Kepler 3.5 GPUs? I.e Run 30 kernels of size <<<1,1024>>> at the same time on a Kepler GPU with 15 SMs?

提前感谢! / p>

Thanks in advance!

推荐答案

在计算能力3.5设备上,这可能是可能的。

On a compute capability 3.5 device, it might be possible.

这些设备每个GPU和2048线程对等多处理器最多支持32个并发内核。对于每个多处理器64k个寄存器,如果它们的寄存器占用量小于每个线程16个并且每个块小于24kb共享内存,则1024个线程的两个块可以并行运行。

Those devices support up to 32 concurrent kernels per GPU and 2048 threads peer multi-processor. With 64k registers per multi-processor, two blocks of 1024 threads could run concurrently if their register footprint was less than 16 per thread, and less than 24kb shared memory per block.

您可以找到所有这些是在CUDA编程指南附录中的硬件描述。

You can find all of this is the hardware description found in the appendices of the CUDA programming guide.

这篇关于CUDA:并发的,独特的内核在同一个多处理器?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆