OpenCL内核的性能非常差吗? [英] OpenCL kernel performing very poor?

查看：220 发布时间：2020/5/20 19:03:08 multithreading performance opencl

本文介绍了OpenCL内核的性能非常差吗?的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我的应用程序使用 GPU上的OpenCL 花费 5200ms 来计算数据集，使用CPU上的 OpenCL花费相同的数据花费 330ms ;而 在不使用多个线程的CPU上在没有OpenCL的情况下完成相同的数据处理则需要110ms . OpenCL计时仅针对内核执行完成，即在clEnqueueNDRangeKernel之前开始，在clFinish之后结束. 我有一个Windows小工具，它告诉我我仅使用19％的GPU.即使我可以做到100％，它仍然需要〜1000ms，这比我的CPU高得多.

My application takes 5200ms for computation of a data set using OpenCL on GPU, 330ms for same data using OpenCL on CPU; while the same data processing when done without OpenCL on CPU using multiple threads takes 110ms. The OpenCL timing is done only for kernel execution i.e. start just before clEnqueueNDRangeKernel and end just after clFinish. I have a Windows gadget which tells me that I am only using 19% GPU power. Even if I could make it to 100% still it would take ~1000ms which is much higher than my CPU.

工作组的大小是CL_KERNEL_PREFERRED_WORK_GROUP_SIZE_MULTIPLE的倍数，我正在使用所有计算单元(GPU为6，CPU为4).这是我的内核:

The work group size is a multiple of CL_KERNEL_PREFERRED_WORK_GROUP_SIZE_MULTIPLE and I am using all computation units (6 for GPU and 4 for CPU). Here is my kernel:

__kernel void reduceURatios(__global myreal *coef, __global myreal *row, myreal ratio)
{
    size_t gid = get_global_id(0);

    myreal pCoef = coef[gid];
    myreal pRow = row[gid];

    pCoef = pCoef - (pRow * ratio);
    coef[gid] = pCoef;
}

对于另一个内核，我的性能也很差:

I am getting similar poor performance for another kernel:

__kernel void calcURatios(__global myreal *ratios, __global myreal *rhs, myreal c, myreal r)
{
    size_t gid = get_global_id(0);

    myreal pRatios = ratios[gid];
    myreal pRHS = rhs[gid];

    pRatios = pRatios / c;
    ratios[gid] = pRatios;

    //pRatios = pRatios * r;
    pRHS = pRHS - (pRatios * r);
    rhs[gid] = pRHS;
}

问题:

为什么与OpenCL上的CPU相比，我的GPU性能这么差?
为什么OpenCL 3X上的CPU比没有OpenCL但多的CPU慢? 线程化了吗?

Why is my GPU performing so poor compared to CPU on OpenCL.
Why is CPU on OpenCL 3X slower than CPU without OpenCL but multi threaded?

OpenCL内核的性能非常差吗? [英] OpenCL kernel performing very poor?

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

OpenCL内核的性能非常差吗? [英] OpenCL kernel performing very poor?

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭