如何编译cuda内核没有优化？ [英] how to compile cuda kernel without optimizing at all?

查看：146 发布时间：2017/3/4 16:09:12 cuda gpgpu

本文介绍了如何编译cuda内核没有优化？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

如果我编译这个

__global__ void dummy_kernel(float *a, int N, float* b, int N2){
    unsigned int i = blockIdx.y*blockDim.y + threadIdx.y;
    unsigned int j = blockIdx.x*blockDim.x + threadIdx.x; 
}

我得到这个空的ptx代码

i get this empty ptx code

.entry _Z9dummy_kernelPfiS_i(
.param .u64 _Z9dummy_kernelPfiS_i_param_0,
.param .u32 _Z9dummy_kernelPfiS_i_param_1,
.param .u64 _Z9dummy_kernelPfiS_i_param_2,
.param .u32 _Z9dummy_kernelPfiS_i_param_3
)
{

ret; 
}

有没有办法强制编译器生成ptx而不进行优化？

Is there a way to force the compiler to generate ptx without optimizing at all?

如何编译cuda内核没有优化？ [英] how to compile cuda kernel without optimizing at all?

问题描述

推荐答案

相关文章

其它硬件开发最新文章

热门教程

热门工具

登录关闭

如何编译cuda内核没有优化？ [英] how to compile cuda kernel without optimizing at all?

问题描述

推荐答案

相关文章

其它硬件开发最新文章

热门教程

热门工具

登录 关闭

登录关闭