sse3相关内容

在 Intel 上使用 SSE2 减少无符号字节的总和而不会溢出

我试图在 Intel i3 处理器上找到 32 个元素(每个 1 字节数据)的总和减少.我是这样做的: s=0;对于 (i=0; i 但是,它需要更多时间,因为我的应用程序是一个需要更少时间的实时应用程序.请注意,最终和可能超过 255. 有没有办法使用低级 SIMD SSE2 指令来实现这一点?不幸的是,我从未使用过 SSE.为此,我尝试搜索 sse2 函数,但它也不可用.是否(sse ..
发布时间:2022-01-06 12:49:37 其他开发

在 x86-SSE 中将四个压缩单精度浮点转换为无符号双字

有没有办法在带有 SSE 扩展的 x86 中将四个打包的单精度浮点值转换为四个双字?最接近的指令是CVTPS2PI,但它不能在两个xmm 寄存器上执行,而应以CVTPS2PI MM, XMM/M64 的形式给出.如果我想要类似 的东西怎么办?XMM, XMM/M128? 谢谢.伊曼. 解决方案 x86 没有对 FPunsigned 的原生支 ..
发布时间:2021-08-27 19:47:14 其他开发