cuda-streams相关内容

流0(默认)和其他流的行为

在CUDA中,流0与其他流有何关系?流0(默认流)是否在上下文中与其他流并发执行? 考虑以下示例: cudaMemcpy(Dst,Src,sizeof(float)* datasize,cudaMemcpyHostToDevice);//流0;cudaStream_t stream1;/...创建stream1 .../somekernel块,线程,0,stream1>(Dst);//流 ..
发布时间:2021-04-27 20:10:22 其他开发

是否可以手动设置用于一个CUDA流的SM?

默认情况下,内核将使用设备的所有可用SM(如果有足够的块).但是,现在我有2个具有1个计算强度和1个内存强度的流,并且我想分别限制2个流使用的最大SM(设置最大SM后,一个流中的内核将使用最大SM,例如20SM用于计算密集型,而4SM用于存储密集型),是否可以这样做?(如果可能,我应该使用哪个API) 解决方案 简而言之,没有办法做您想像的事情. CUDA执行模型没有提供这种粒度,这 ..
发布时间:2021-04-27 20:08:21 其他开发

同一多处理器上并发的唯一内核?

在Kepler 3.5 GPU中,是否可以使用流在同一个流式多处理器上具有多个唯一内核? IE.在带有15个SM的开普勒GPU上同时运行大小为>>的30个内核? 解决方案 在具有3.5计算能力的设备上,这可能是可能的. 这些设备每个GPU支持多达32个并发内核,并具有2048个线程对等多处理器.如果每个多处理器有64k寄存器,那么如果每个线程的寄存器占用空间小于1 ..
发布时间:2020-07-20 20:11:30 其他开发