在 Intel 上使用 SSE2 减少无符号字节的总和而不会溢出 我试图在 Intel i3 处理器上找到 32 个元素(每个 1 字节数据)的总和减少.我是这样做的: s=0;对于 (i=0; i 但是,它需要更多时间,因为我的应用程序是一个需要更少时间的实时应用程序.请注意,最终和可能超过 255. 有没有办法使用低级 SIMD SSE2 指令来实现这一点?不幸的是,我从未使用过 SSE.为此,我尝试搜索 sse2 函数,但它也不可用.是否(sse .. 发布时间:2022-01-06 12:49:37 x86 sse simd sse2 sse3 其他开发
在 x86-SSE 中将四个压缩单精度浮点转换为无符号双字 有没有办法在带有 SSE 扩展的 x86 中将四个打包的单精度浮点值转换为四个双字?最接近的指令是CVTPS2PI,但它不能在两个xmm 寄存器上执行,而应以CVTPS2PI MM, XMM/M64 的形式给出.如果我想要类似 的东西怎么办?XMM, XMM/M128? 谢谢.伊曼. 解决方案 x86 没有对 FPunsigned 的原生支 .. 发布时间:2021-08-27 19:47:14 assembly x86-64 sse floating-point-conversion sse3 其他开发
在Intel上使用SSE2减少无符号字节的总和而不会发生溢出 我正在尝试在Intel i3处理器上减少32个元素(每个1字节数据)的总和.我是这样做的: s=0; for (i=0; i .. 发布时间:2020-07-09 21:16:10 x86 sse simd sse2 sse3 其他开发