loop-unrolling - IT屋-程序员软件开发技术分享社区

循环展开没有给出浮点点积的预期加速比

/* Inner product. Accumulate in temporary */ void inner4(vec_ptr u, vec_ptr v, data_t *dest) { long i; long length = vec_length(u); data_t *udata = get_vec_start(u); data_t *vda ..

发布时间：2022-08-07 12:27:42 c x86-64 cpu-architecture dot-product loop-unrolling 其他开发

为什么V8和蜘蛛猴似乎都没有展开静态循环？

做一个小检查，看起来V8和蜘蛛猴都没有展开循环，即使很明显，它们有多长(字面上是条件，在本地声明)：数据-lang=“js”数据-隐藏=“假”数据-控制台=“真”数据-巴贝尔=“假”> const f = () => { let counter = 0; for (let i = 0; i ..

发布时间：2022-06-15 11:58:20 javascript v8 spidermonkey loop-unrolling 前端开发

如何用 g++ 向量化我的循环?

我在搜索时找到的介绍链接: 6.59.14 Loop-Specific Pragmas 2.100 Pragma Loop_Optimize 如何向 gcc 提供有关循环计数的提示告诉 gcc 专门展开循环如何在 C++ 中强制向量化正如您所见，它们中的大多数都是用于 C 的，但我认为它们也可能适用于 C++.这是我的代码: template//__attribute_ ..

发布时间：2022-01-23 20:30:35 c++ optimization g++ vectorization loop-unrolling C/C++开发

在 g++ 上进行聚合初始化的 std::array 会生成大量代码

在 g++ 4.9.2 和 5.3.1 上，此代码需要几秒钟才能编译并生成 52,776 字节的可执行文件: #include #include 主函数(){constexpr std::size_t 大小 = 4096;结构 S{浮动 f;S() : f(0.0f) {}};std::array一个 = {};// ..

发布时间：2022-01-23 20:24:16 c++ optimization g++ stdarray loop-unrolling C/C++开发

C/C++ 中的自展开宏循环

我目前正在处理一个项目，其中每个周期都很重要.在分析我的应用程序时，我发现一些内部循环的开销非常高，因为它们只包含一些机器指令.此外，这些循环中的迭代次数在编译时是已知的. 所以我想不是用 copy & 手动展开循环.我可以使用宏在编译时展开循环，以便以后可以轻松修改. 我的印象是这样的: #define LOOP_N_TIMES(N, CODE) 这样我就可以替换 for (i ..

发布时间：2021-12-24 15:12:45 c++ c boost macros loop-unrolling C/C++开发

如何使用 g++ 向量化我的循环?

我在搜索时找到的介绍性链接: 6.59.14 Loop-Specific Pragmas 2.100 Pragma Loop_Optimize 如何向 gcc 提示循环计数告诉 gcc 专门展开一个循环如何在 C++ 中强制矢量化正如你所看到的，它们中的大部分是针对 C 的，但我认为它们也可能适用于 C++.这是我的代码: template//__attribute__ ..

发布时间：2021-12-20 16:24:07 c++ optimization g++ vectorization loop-unrolling C/C++开发

在 g++ 上进行聚合初始化的 std::array 生成大量代码

在 g++ 4.9.2 和 5.3.1 上，这段代码需要几秒钟的时间来编译并生成一个 52,776 字节的可执行文件: #include #include int main(){constexpr std::size_t 大小 = 4096；结构体{浮动 f;S() : f(0.0f) {}};std::arraya = {};// ..

发布时间：2021-12-20 16:16:18 c++ optimization g++ stdarray loop-unrolling C/C++开发

我在 ARM 处理器上运行了以下循环. //这里的 pin 是指向数组某部分的指针for (i = 0; i numelements; i++){pe = pptr[i];peParent = pe->parent;SPHERE *ps = (SPHERE *)(pe->data);pin[0] = FLOAT2FIX(ps->rad2);pin[1] = *peParent->procs->p ..

发布时间：2021-11-17 22:24:23 c gcc arm loop-unrolling 其他开发

展开将如何影响每个元素计数 CPE 的周期

如何使用这些代码片段计算 CPE(每个元素的周期数)? 两个给定代码片段之间的 CPE 有何不同? 我有这段代码 void randomFunction(float a[],float Tb[],float c[],long int n){输入 i,j,k;for(i=0;i 这是最内层循环的程序集，来自 GCC10.3 -O2 (https://godbolt.org/z/cWE16 ..

发布时间：2021-09-29 19:32:51 c assembly x86 cpu-architecture loop-unrolling 其他开发

编译时内的模板参数展开 for 循环?

维基百科(此处)给出了 for 循环的编译时展开.......我想知道我们可以在内部使用带有模板语句的类似 for 循环吗...例如... 以下循环是否有效 templatevoid Device::createSubDomains(){for(int i=0; i ..

发布时间：2021-09-04 20:47:42 c++ templates loop-unrolling C/C++开发

#pragma展开功能到底有什么作用?它会影响线程数吗?

我是CUDA的新手，我无法理解循环展开.我已经编写了一段代码来了解该技术 __ global__ void kernel(float * b，int size){int tid = blockDim.x * blockIdx.x + threadIdx.x;#pragma展开for(int i = 0; i ..

发布时间：2021-04-27 20:08:39 cuda nvidia pragma loop-unrolling 其他开发

允许结构字段溢出到下一个字段

考虑以下简单示例: struct __attribute__((__packed__)){整数代码[1];int place_holder [100];} s;无效测试(int n){我对于(i = 0; i的 ..

发布时间：2021-04-23 20:06:54 c gcc struct compiler-optimization loop-unrolling 其他开发

确定CUDA中#pragma展开N的最佳值

我了解 #pragma展开的工作方式，但是如果我有以下示例： __ global__ void test_kernel（const float * B，const float * C，float * A_out） { int j = threadIdx.x + blockIdx.x * blockDim。 X; if（j ..

发布时间：2020-10-13 01:20:22 cuda pragma loop-unrolling 其他开发

GCC中的循环展开行为

该问题部分是 GCC 5.1循环展开的后续问题。根据 GCC文档，正如我对上述问题的回答所述， -funroll-loops 之类的标志会打开“完全循环剥离（即完成删除迭代次数很少的循环”）。因此，启用此类标志后，如果编译器确定可以优化给定代码段的执行，则可以选择展开循环。不过，我在我的一个项目中注意到，即使未启用相关标志，有时GCC也会展开循环。例如，考虑以下简单的代码段： ..

发布时间：2020-10-06 23:21:06 c++ gcc compiler-optimization loop-unrolling C/C++开发

为什么clang无法展开循环（gcc展开）？

我正在用C编写并使用clang进行编译。我正在尝试展开一个循环。循环未展开：优化器无法执行请求的转换；循环未展开。该转换可能被禁用或被指定为不支持的转换命令的一部分[-Wpass-failed = transform-warning] 您可以在此处找到结果： https://godbolt.org/z/4flN-k int foo（int c） { size_t w = ..

发布时间：2020-10-01 22:56:18 c gcc clang loop-unrolling 其他开发

SSE内部和循环展开

我正在尝试优化某些循环，并且已经进行了管理，但是我想知道是否仅将其部分纠正了.比如说我有这个循环: for(i=0;i ..

发布时间：2020-05-21 21:16:36 c++ optimization sse loop-unrolling C/C++开发

Java JIT循环展开策略?

JIT的循环展开策略是什么?或者，如果没有简单的答案，那么有什么方法可以检查循环中展开循环的位置/时间? GNode child = null; for(int i=0;i ..

发布时间：2020-05-21 20:42:19 java optimization compiler-construction jit loop-unrolling Java开发

C/C ++中的自展开宏循环

我目前正在从事一个项目，每个周期都很重要.在对我的应用程序进行性能分析时，我发现某些内部循环的开销非常高，因为它们仅包含一些机器指令.此外，这些循环的迭代次数在编译时是已知的. 因此，我认为不是使用copy&手动展开循环.粘贴，我可以在编译时使用宏展开循环，以便以后可以轻松对其进行修改. 我的形象是这样的: #define LOOP_N_TIMES(N, CODE) ..

发布时间：2020-05-05 08:48:59 c++ c boost macros loop-unrolling C/C++开发

我应该看看PTX来优化我的内核吗？如果是，如何？

您是否建议您阅读内核的PTX代码，以便进一步优化内核？一个例子：我读到，可以从PTX代码找出自动循环展开是否有效。如果不是这种情况，则必须在内核代码中手动展开循环。 PTX代码还有其他用例吗？你看看你的PTX代码吗？我在哪里可以找到如何读取CUDA为我的内核生成的PTX代码？解决方案关于PTX的第一点是，它只是在GPU上运行的代码的一个中间表示 - 虚拟机汇编语言 ..

发布时间：2017-03-04 15:59:51 performance cuda gpgpu ptx loop-unrolling 其它硬件开发

如何使用g ++向量化我的循环？

在搜索时发现的介绍性链接： 6.59.14 Loop-Specific Pragmas 2.100 Pragma Loop_Optimize https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html -O3打开-O2指定的所有优化，并打开-finline函数，-funswitch-loops ，-fpredictive-com ..

发布时间：2016-10-17 10:16:43 c++ optimization g++ vectorization loop-unrolling C/C++开发

loop-unrolling相关内容