首页
C/C++开发
什么是“正确的”方式来实现CUDA的32位memset？

什么是“正确的”方式来实现CUDA的32位memset？ [英] What's the 'right' way to implement a 32-bit memset for CUDA?

查看：808 发布时间：2016/10/20 23:48:29 c++ cuda memset

本文介绍了什么是“正确的”方式来实现CUDA的32位memset？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

CUDA有API调用

CUDA has the API call

cudaError_t cudaMemset (void *devPtr, int value, size_t count)

用单字节值填充缓冲区。我想用一个多字节值填充它。假设，为了简单起见，我想用一个32位（4字节）的值填充 devPtr ，并假设我们可以忽略字节序。现在，CUDA驱动程序具有以下API调用：

which fills a buffer with a single-byte value. I want to fill it with a multi-byte value. Suppose, for the sake of simplicity, that I want to fill devPtr with a 32-bit (4-byte) value, and suppose we can ignore endianness. Now, the CUDA driver has the following API call:

CUresult cuMemsetD32(CUdeviceptr dstDevice, unsigned int ui, size_t N)

这样就足够了：获取 CUdeviceptr 从设备内存空间指针，然后进行驱动程序API调用？

So is it enough for me to just: obtain the CUdeviceptr from the device-memory-space pointer, then make the driver API call? Or is there something else I need to be doing?

推荐答案

关于CUDA 3.0，运行时API设备指针（和其他一切）可以与驱动程序API互操作。所以，是的，您可以使用 cuMemsetD32 以32位值填充运行时API分配。 CUdeviceptr 的大小将匹配您平台上的 void * 的大小，并且可以安全地从CUDA API至 CUdeviceptr 或反之亦然

As of about CUDA 3.0, runtime API device pointers (and everything else) are interoperable with the driver API. So yes, you can use cuMemsetD32 to fill a runtime API allocation with a 32 bit value. The size of CUdeviceptr will match the size of void *on you platform and it is safe to cast a pointer from the CUDA API to CUdeviceptr or vice versa.

这篇关于什么是“正确的”方式来实现CUDA的32位memset？的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

相关文章

什么是正确的方式来等待连接？;

正确的方式来实现ICloneable;

正确的方式来实现的IXmlSerializable？;

什么是正确的方式来调暗屏幕？;

什么是正确的方式实现QThread ...（示例请...）;

什么是不好移32位变量32位？;

CUDA / PTX 32位与64位;

什么是正确的方式来设置阴影复制默认的AppDomain;

什么是最快的方式来旋转位的8x8块中的位？;

为什么String.GetHashCode（）来实现不同的CLR的32位和64位版本？;

什么是*正确*方式来取消设置CSS中的行为属性？;

什么是正确的emberjs方式来切换各种过滤选项？;

什么是正确的方式来告诉浏览器不缓存？;

什么是正确的方式来清除后台活动/ activites从栈？;

什么是最快的方法来计数UInt32中的设置位;

什么是正确的，pcated非德$ P $的方式来唤醒设备？;

什么是 16 位、32 位和 64 位架构?;

什么是 16 位、32 位和 64 位架构?;

什么是 16 位、32 位和 64 位架构?;

为什么是64位的MSBuild加载32位扩展？;

AES加密的32位实现;

什么是正确的方法来实现is_swappable来测试可交换的概念？;

什么是Android的正确的方式实现开关case语句？ [解决了];

什么是Scala的方式来实现像这样的可重试的电话？;

什么是 Scala 方式来实现这个 Java“byte[] to Hex"?班级;

C/C++开发最新文章

应用程序无法启动，因为它无法找到或加载QT平台插件“窗口”;

CMake错误在CMakeLists.txt：30（项目）：没有CMAKE_C_COMPILER可以找到;

未定义的引用google :: protobuf :: internal :: empty_string_ [abi：cxx11];

什么0LL或0x0UL是什么意思？;

由于未定义的引用，无法获取OpenCV进行编译？;

Visual Studio 2012 - 错误LNK1104：无法打开文件'glew32.lib';

如何让cmake的CUDA找到;

由于捕获缓冲区，OpenCV VideoCapture延迟;

LINK：致命错误LNK1248：映像大小超过最大允许大小（80000000）;

C ++的错误：＆QUOT;数组必须用一个括号括起来的初始化＆QUOT初始化;;

热门教程

Java教程

Apache ANT 教程

Kali Linux教程

JavaScript教程

JavaFx教程

MFC 教程

Apache HTTP客户端教程

Microsoft Visio 教程

热门工具

Java 在线工具

C(GCC) 在线工具

PHP 在线工具

C# 在线工具

Python 在线工具

MySQL 在线工具

VB.NET 在线工具

Lua 在线工具

Oracle 在线工具

C++(GCC) 在线工具

Go 在线工具

Fortran 在线工具

登录关闭

扫码关注1秒登录

发送“验证码”获取 | 15天全站免登陆

友情链接： IT屋 Chrome插件谷歌浏览器插件

IT屋 ©2016-2022 琼ICP备2021000895号-1 站点地图站点标签 SiteMap <免责申明> 本站内容来源互联网,如果侵犯您的权益请联系我们删除.