population-count相关内容

使用 AVX-512 或 AVX-2 对大数据计算 1 位(人口计数)

我有一大块内存,比如 256 KiB 或更长.我想计算整个块中 1 位的数量,或者换句话说:将所有字节的“人口计数"值相加. 我知道 AVX-512 有一个 VPOPCNTDQ 指令计算 512 位向量内每个连续 64 位中 1 位的数量,并且 IIANM 应该可以在每个周期发出其中一个(如果有合适的 SIMD 向量寄存器可用) - 但我没有任何经验编写 SIMD 代码(我更像是一个 GPU ..
发布时间:2021-12-18 09:23:52 其他开发

使用AVX-512或AVX-2对大数据计数1位(填充计数)

我有很长的内存,例如256 KiB或更长时间.我想计算整个块中1位的数目,或者换句话说:将所有字节的“填充计数"值相加. 我知道AVX-512具有 VPOPCNTDQ指令计算512位向量中每个连续64位中1位的数目,而IIANM应该可以在每个周期中发布一个(如果有合适的SIMD矢量寄存器)-但是我没有任何经验编写SIMD代码(我是GPU专家).另外,我不确定100%是否支持AVX-512目标 ..
发布时间:2020-07-29 21:22:22 其他开发