vectorization - IT屋-程序员软件开发技术分享社区

AVX性能对于按位XOR运算和POP计数较慢

我对编写一些基于AVX内部函数的代码是新手，所以需要一些帮助来理解我的观察结果。我有两个实现距离计算的方法，这两个方法都接受2个浮点数组及其维度，并返回一个浮点距离。第一种方法计算欧几里得距离 static float compute_l2Square(const void *pVect1v, const void *pVect2v, const void *qty_ptr) ..

发布时间：2022-08-17 19:03:27 c++11 vectorization compiler-optimization simd avx 其他开发

NumPy垂直函数：'；浮动'；对象不可订阅

我有一个麻木的阵列： import numpy as np pval=np.array([[0., 0.,0., 0., 0.,0., 0., 0.], [0., 0., 0., 0., 0.,0., 0., 0.]]) 和矢量化函数： def getnpx(age): return pval[0]+age vgetnpx = np. ..

发布时间：2022-05-26 15:38:26 python numpy vectorization numpy-ndarray array-broadcasting Python

NUMPY矢量化np.prod不能构造具有超过32个操作数的ufunc

我知道这里也有类似的问题：Python numpy.vectorize: ValueError: Cannot construct a ufunc with more than 32 operands 但我的情况不同。我有一个32列的df，您可以通过运行以下代码来拥有它： import numpy as np import pandas as pd from io import ..

发布时间：2022-05-26 14:26:07 python pandas numpy vectorization numpy-ndarray Python

无环卡方网格搜索在PYTHON NumPy中的实现

最佳拟合线性参数A和B(y=Ax+b)对应于这些参数上的卡方函数的最小值。我想对全局卡方极小值进行强力网格搜索(因为两参数线性卡方是抛物面)，并已通过3个嵌套循环(如下所示)实现，但希望避免循环(即，使用Numpy的数组广播属性进行矢量化)。卡方(加权最小二乘)定义为： Chi-square(k,j) = sum (y[i]-(A[k]*x[i]+B[j]))/yerr[i])^2 ..

发布时间：2022-05-23 17:54:49 python numpy multidimensional-array vectorization curve-fitting Python

追加到循环中的数组-Python

请参阅this问题了解精简版我在写重力模拟。我的代码结构是： Asolution数组-它包含质量系统的(已计算的)解。由于Python中求解微分方程的本质，所有相关值(每个质量在每个时间值的位置和速度的每个分量)都在solution数组中。数组masses。此处的对象包含有关每个质量的所有信息，包括我下面尝试更新的数组x_history。不是。维度d。此处为简单起见， ..

发布时间：2022-03-17 09:24:42 python vectorization Python

将条件中的数值数组值替换为随机数

我需要将基于条件的数值数组中的某些值替换为随机数。我有一个函数，50%的时间会将随机值相加： def add_noise(noise_factor=0.5): chance = random.randint(1,100) threshold_prob = noise_factor * 100. if chance ..

发布时间：2022-03-17 09:20:10 python arrays numpy random vectorization Python

沿轴计算直方图

是否有办法沿ND数组的轴计算多个直方图？我当前使用方法使用for循环迭代所有其他轴，并为每个结果一维数组计算numpy.histogram()： import numpy import itertools data = numpy.random.rand(4, 5, 6) # axis=-1, place `200001` and `[slice(None)]` on any other ..

发布时间：2022-03-17 09:14:26 python performance numpy scipy vectorization Python

将PANDAS.DataFrame的集成矢量化

我有DataFrame个力-位移数据。位移数组已设置为DataFrame索引，列是我针对不同测试的各种力曲线。如何计算已完成的功(即“曲线下面积”)？我查看了numpy.trapz，它似乎做了我需要的事情，但我认为我可以避免像这样循环遍历每一列： import numpy as np import pandas as pd forces = pd.read_csv(... ..

发布时间：2022-03-17 09:09:45 python numpy pandas vectorization numerical-integration Python

使用numpy优化水平和垂直邻接计算

我有以下单元格： cells = np.array([[1, 1, 1], [1, 1, 0], [1, 0, 0], [1, 0, 1], [1, 0, 0], [1, 1, 1]]) 我要计算水平邻接和垂直 ..

发布时间：2022-03-17 09:05:16 python numpy performance optimization vectorization Python

向量化函数(Python)

我是Python新手，正在尝试执行硬件分配，它不断向我抛回此错误(在IPython笔记本中)： "TypeError: unsupported operand type(s) for ** or pow(): 'list' and 'float'" 这里是我试图模仿的公式：h(X)=(1/√2π)*e^−(1/2)^x^2 import numpy as np import mat ..

发布时间：2022-03-17 09:00:49 python numpy scipy vectorization scalar Python

Numpy如何使用np.umprod重写range函数中i的python

我有两个python函数。第一个： mt = np.array([1, 2, 3, 4, 5, 6, 7]) age, interest = 3, 0.5 def getnpx(mt, age, interest): val = 1 initval = 1 for i in range(age, 6): val = val * mt[i] ..

发布时间：2022-03-16 23:49:14 python numpy vectorization numpy-ndarray Python

从AVX寄存器中提取并存储交替的低32位

我有一个__m256i寄存器，我想从每个64位组中提取4个低32位，将它们打包并连续存储到内存中。即，如果__m256i寄存器包含8个32位字：{a0，a1，a2，a3，a4，a5，a6，a7}，我希望将四个字{a0，a2，a4，a6}连续存储到存储器我编写了以下代码： void mystore(uint32 *dst, const __m256i& src) { __m ..

发布时间：2022-03-16 23:42:56 vectorization simd intrinsics avx2 其他开发

Numpy如何在Range函数中使用np.umprod向量化i的python

我有两个python函数。第一个： import numpy as np import math mt = np.array([1, 2, 3, 4, 5, 6, 7]) age, interest = 3, 0.5 def getnpx(mt, age, interest): val = 1 initval = 1 for i in range(age, 7): ..

发布时间：2022-03-16 23:36:07 python numpy vectorization numpy-ndarray Python

自动向量化比较

我在将g++5.4用于比较时遇到问题。基本上，我想使用向量化比较4个无符号整数。我的第一个方法是直截了当的： bool compare(unsigned int const pX[4]) { bool c1 = (temp[0] ..

发布时间：2022-03-16 23:31:56 c++ vectorization avx2 C/C++开发

是“*申请"吗?家庭真的没有向量化吗?

所以我们习惯于对每个 R 新用户说“apply 不是矢量化的，请查看 Patrick Burns R Inferno Circle 4" 上面写着(我引用): 一个常见的反应是使用 apply 系列中的一个函数.这不是向量化，它是循环隐藏的.apply 函数有一个 for 循环它的定义.lapply 函数隐藏了循环，但执行时间往往大致等于一个显式的 for 循环. 确实，快速浏览一下 ..

发布时间：2022-01-30 22:06:33 r performance loops vectorization apply 其他开发

pandas 中的 for 循环真的很糟糕吗?我什么时候应该关心?

for 循环真的“不好"吗?如果不是，在什么情况下它们会比使用更传统的“矢量化"方法更好?1 我熟悉“矢量化"的概念，以及 pandas 如何使用矢量化技术来加快计算速度.矢量化函数在整个系列或 DataFrame 上广播操作，以实现比传统迭代数据更快的速度. 但是，我很惊讶地看到许多代码(包括来自 Stack Overflow 上的答案)提供了涉及使用 for 循环和列表推导来循环数 ..

发布时间：2022-01-24 11:18:51 python pandas iteration vectorization list-comprehension Python

double 和 ffast-math 上的自动矢量化

为什么必须使用 -ffast-math 和 g++ 来实现使用 doubles 的循环向量化?我不喜欢 -ffast-math 因为我不想失去精度. 解决方案使用 -ffast-math 不一定会丢失精度.它只影响NaN、Inf等的处理以及操作执行的顺序. 如果您不希望 GCC 重新排序或简化计算的特定代码段，您可以使用 asm 语句将变量标记为正在使用. 例如，以下代码对 ..

发布时间：2022-01-23 21:14:08 gcc g++ double vectorization fast-math 其他开发

如何用 g++ 向量化我的循环?

我在搜索时找到的介绍链接: 6.59.14 Loop-Specific Pragmas 2.100 Pragma Loop_Optimize 如何向 gcc 提供有关循环计数的提示告诉 gcc 专门展开循环如何在 C++ 中强制向量化正如您所见，它们中的大多数都是用于 C 的，但我认为它们也可能适用于 C++.这是我的代码: template//__attribute_ ..

发布时间：2022-01-23 20:30:35 c++ optimization g++ vectorization loop-unrolling C/C++开发

为什么鼓励 Julia 中的去向量化?

在 Julia 中似乎鼓励编写去向量化代码.甚至还有一个包会尝试为您做到这一点. 我的问题是为什么? 首先，从用户体验方面来说，矢量化代码更简洁(代码更少，错误的可能性更小)，更清晰(因此更容易调试)，更自然的代码编写方式(至少对于某些人来说)谁来自科学计算背景，Julia 试图迎合谁).能够写出 vector'vector 或 vector'Matrix*vector 之类的东西 ..

发布时间：2022-01-23 19:09:02 multithreading vectorization julia 其他开发

术语“矢量化"是否适用于“向量化"?在不同的情况下意味着不同的东西?

..

发布时间：2022-01-23 19:01:08 r julia vectorization 其他开发

vectorization相关内容