首页
其他开发
GPU组如何进入扭曲/波阵面?

GPU组如何进入扭曲/波阵面? [英] How does a GPU group threads into warps/wavefronts?

查看：118 发布时间：2020/7/31 1:54:04 gpu gpgpu gpu-warp

本文介绍了GPU组如何进入扭曲/波阵面?的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我的理解是，warp是在运行时通过任务调度程序定义的一组线程，CUDA的性能关键部分是warp中的线程差异，有没有办法很好地猜测硬件的方式会在线程块内构造经线吗?

My understanding is that warp is a group of threads that defined at runtime through the task scheduler, one performance critical part of CUDA is the divergence of threads within a warp, is there a way to make a good guess of how the hardware will construct warps within a thread block?

例如，我已经在一个线程块中启动了一个具有1024个线程的内核，那么线程的排列方式如何，我能否从线程索引中得知(或至少可以作一个很好的猜测)?

For instance I have start a kernel with 1024 threads in a thread block, how is the warps be arranged, can I tell that (or at least make a good guess) from the thread index?

通过这样做，可以最大程度地减少给定经线内线程的差异.

Since by doing this, one can minimize the divergence of threads within a given warp.

推荐答案

warp中的线程安排与实现有关，但是atm我始终遇到相同的行为:

The thread arrangement inside the warp is implementation dependant but atm I have experienced always the same behavior:

warp由32个线程组成，但是warp调度程序每次会发出1条指令来暂停一次warp(16个线程)

A warp is composed by 32 threads but the warp scheduller will issue 1 instruction for halp a warp each time (16 threads)

如果使用1D块(仅threadIdx.x尺寸有效)，则扭曲调度程序将针对 threadIdx.x =(0..15)(16..31)发出1条指令 ...等等

如果使用2D块(threadIdx.x和threadIdx.y尺寸有效)，那么扭曲调度程序将尝试按照以下方式发出:

If you use 2D blocks (threadIdx.x and threadIdx.y dimension are valid) then the warp scheduller will try to issue following this fashion:

threadIdx.y = 0 threadIdx.x =(0 ..15)(16..31) ...等

因此，具有连续threadIdx.x组件的线程将以16为一组执行同一条指令.

so, the threads with consecutive threadIdx.x component will execute the same instruction in groups of 16.

这篇关于GPU组如何进入扭曲/波阵面?的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

相关文章

如何进入;

如何进入屏幕对象;

我该如何进入;

如何进入当前分支?;

如何进入日期之间;

如何进入亚音速？;

我们如何进入页面顶部;

如何进入系统“呼叫"状态?;

如何进入码头集装箱？;

如何进入 Docker 容器的外壳?;

如何进入FutureTask执行状态？;

键盘输入如何进入终端?;

如何进入Docker容器的外壳？;

如何进入system.web.mvc;

Vim:如何进入随处插入/画布模式?;

Xcode 5 如何进入存储库窗口?;

jvm如何进入public static void main？;

如何进入空闲状态prevent的Windows？;

执行 bashscript 时如何进入 Python virtualenv?;

如何进入电话会议时确定？;

如何进入全球JS变量AngularJS指令;

MFC SDI CDocument我如何进入视图;

如何进入MonoDevelop中的Framework源代码;

curl-如何进入下一页?;

如何进入每个目录并执行命令?;

其他开发最新文章

拒绝显示一个框架，因为它将'X-Frame-Options'设置为'sameorigin';

什么是＆QUOT; AW＆QUOT;在部分标志属性是什么意思？;

在运行npm install命令时获取'npm WARN弃用'警告;

cmake无法找到openssl;

从Spark的scala中的* .tar.gz压缩文件中读取HDF5文件;

Twitter :: Error :: Forbidden - 无法验证您的凭据;

我什么时候需要一个fb：app_id或者fb：admins？;

将.db文件导入R;

npm通知创建一个lockfile作为package-lock.json。你应该提交这个文件;

拒绝执行内联脚本，因为它违反了以下内容安全策略指令：“script-src'self'”;

热门教程

Java教程

Apache ANT 教程

Kali Linux教程

JavaScript教程

JavaFx教程

MFC 教程

Apache HTTP客户端教程

Microsoft Visio 教程

热门工具

Java 在线工具

C(GCC) 在线工具

PHP 在线工具

C# 在线工具

Python 在线工具

MySQL 在线工具

VB.NET 在线工具

Lua 在线工具

Oracle 在线工具

C++(GCC) 在线工具

Go 在线工具

Fortran 在线工具

登录关闭

扫码关注1秒登录

发送“验证码”获取 | 15天全站免登陆

友情链接： IT屋 Chrome插件谷歌浏览器插件

IT屋 ©2016-2022 琼ICP备2021000895号-1 站点地图站点标签 SiteMap <免责申明> 本站内容来源互联网,如果侵犯您的权益请联系我们删除.