vectorization 第41页 - IT屋-程序员软件开发技术分享社区

在大型数据集中每次提交案件的时候，开放案件的计数方法是有效的

在一个大型数据集（〜1M个案例）中，每个案例都有一个“创建”和“审查” dateTime 。我想计算在每个案例创建时打开的其他案例的数量。案例在他们的“创建”和“被审查”之间打开 dataTimes 。几个解决方案适用于小数据集 20分钟，6 * 4GHz内核和64GB RAM。即使使用多核心图书馆，最多也可以将时间缩短到8或10倍。不足以处理〜1M个案例。我正在寻找为了更有效的方 ..

发布时间：2017-07-13 20:32:51 r performance data.table dplyr vectorization 其他开发语言

以1个I / O传递方式提取numpy字典中最快的方式

假设我有一个数组： arr = np.array（[[1,20,5] [1,20,8]， [3,10,4]， [2,30,6]， [3,10,5]]），我想形成一个字符串，为每行匹配每个值的第三列的总和在第一列中，即返回 {1：13，2：6，3：9} 。为了使事情变得更具挑战性，我的阵列中有10亿行，第一列有10万行。方法1：可以调用 np.uniq ..

发布时间：2017-05-21 21:32:56 python numpy pandas dictionary vectorization Python

映射2个向量 - 帮助向量化

在Matlab中工作我有两个不同长度的x坐标向量。例如： xm = [15 20 24 25 26 35 81 84 93]; xn = [14 22 26 51 55 59 70 75 89 96]; 我需要将xm映射到xn，换句话说，找出xn中的哪个坐标最接近XM。所以如果我有与这些坐标相关联的值，我可以使用这个地图作为索引，并将这些值相关联。两个向量 ..

发布时间：2017-05-21 14:54:23 performance matlab map vector vectorization 其他开发

用大熊猫数据框向量化复杂切片

为了速度，我希望能够向量化这段代码。目的是计算一个函数，在这种情况下是从两个单独的数组中引用的一对日期的元组的标准偏差。 import pandas as pd import numpy as np asd_1 = pd.Series 0.01 * np.random.randn（252），index = pd.date_range（'2011-1-1'，periods = 2 ..

发布时间：2017-04-14 05:21:15 datetime pandas numpy vectorization Python

为什么sapply返回需要转置的矩阵，然后转置的矩阵不会附加到数据帧？

我将会深入了解为什么会发生这种情况，以及我如何更雄心勃勃地这样做。当我使用sapply时，我希望它返回一个3x2矩阵，但它返回一个2x3矩阵。为什么是这样？为什么很难将其附加到另一个数据框？ a ..

发布时间：2017-04-03 14:28:06 r data-structures vectorization apply 其他开发

使用数据帧列表和向量列表并行使用子集

这样做：洋葱$ yearone $ id％in％mask $ yearone 这不是：洋葱[1] [1]％mask％1 onion [1] ['id']％in％mask [1] 为什么？没有一个明显的方式来向量化DF和成员中的并行列（所以我每年只能在DF和成员中都存在id），我使用for循环，但是我并不幸运地找到表达索引的正确方法...帮助 ..

发布时间：2017-03-26 04:34:29 r dataframe vectorization subset 其他开发

R data.frame从变量中获取值，该变量由另一个变量选择，向量化

我有一些数据带有许多类似的变量，其中有一个额外的变量，它指出了我真正想要的那些类似变量的哪一个。使用循环我可以查找正确的值，但是数据很大，循环很慢，看起来应该是可以向量化的。我只是没有想出如何。编辑：所选的变量将被用作同一数据框架中的新变量，所以顺序很重要。下面给出的示例中还没有显示许多其他变量。示例数据集： set.seed（0） df ..

发布时间：2017-03-26 03:30:53 r dataframe vectorization 其他开发

将单个数据帧值与同一列中的前10个进行比较

在数据框中，我想计算过去10天的价格是多于今天的价格。结果将如下所示： price ct> prev10 50.00 51.00 52.00 50.50 51.00 50.00 50.50 53.00 52.00 49.00 51.00 3 我已经看到这个帖子由帝斯曼回答，但是要求是不同的，因为比较的基础是一个静态数字而不是当前 ..

发布时间：2017-03-26 03:03:47 python pandas conditional dataframe vectorization Python

从数据帧的第n列获取值，每行的n个不同

如何从某些数据框架的 n 列中构造一个值向量，其中 n 是一个在一些向量中定义的每行值？示例： > df df abc 1 100 200 300 2 110 210 310 ..

发布时间：2017-03-26 02:18:46 r dataframe vectorization 其他开发

python大熊猫 - 创建一个列，保持连续值的运行计数

我正在尝试创建一个列（“consec”），它将在不使用循环的情况下保持其他（“二进制”）中连续值的运行计数。这就是想要的结果：。二进制consec 1 0 0 2 1 1 3 1 2 4 1 3 5 1 4 5 0 0 6 1 1 7 1 2 8 0 0 然而，这... df ['consec'] [df ['binary' ..

发布时间：2017-03-26 01:45:05 python pandas dataframe vectorization Python

将lm应用于由第三列定义的数据帧子集

我有一个数据框，其中包含一个x值的向量，一个y值的向量和一个ID的向量： x 我想为x和y共享相同ID的子集创建一个单独的lm。 ..

发布时间：2017-03-26 01:36:31 r dataframe vectorization 其他开发

矢量化操作的速度取决于数据列的数量

为什么要对具有相同数量元素的数据框架进行比较操作需要更长时间，但是在向量化操作的更多列中排列？以这个简单的例子，我们从每个元素减去0.5，然后比较它，看看它是否是 ..

发布时间：2017-03-26 00:30:06 performance r dataframe vectorization 其他开发

向量化的“in”功能在朱莉亚？

我经常想循环一个数据帧的长数组或列，对于每个项目，看它是否是另一个数组的成员。而不是做 giant_list = [“a”，“c”，“j”] good_letters = [“一个“，”b“] isin = falses（size（giant_list，1）） for i = 1：size（giant_list，1） isin [i] = giant_list [i] in g ..

发布时间：2017-03-26 00:09:02 dataframe vectorization julia-lang 其他开发

R数据表，访问赋值函数内的矩阵

我有以下data.table 结构（list（xi = c（1,1,1,2 ，2,2,3,3,3），yi = c（1,2， 3,1,2,3,1,2,3），flag = c（0,0,0,0），0,0,0,0,0）），.names = c（“xi”， “yi”，“flag”），row.names = c（NA，-9L），class = c （“data.table”， “data.frame ..

发布时间：2017-03-12 12:24:47 r data.table vectorization 其他开发

更有效的方法计算每个案件的创建时间的开箱

我想找一种更有效的方法来计算每个案例的创建时间开放的案例数。案例在其创建日期/时间戳与其检查器日期/时间戳之间是“打开的”。您可以复制并粘贴以下代码，查看一个简单的功能示例：＃为我们创建一堆日期/时间戳示例 two_thousand ..

发布时间：2017-03-12 12:00:50 r performance data.table dplyr vectorization 其他开发

在大数据集中每个案例提交时计算打开案例的有效方法

在大型数据集（〜1M个案）中，每个案例都有一个“创建”和一个“审查” dateTime 。我想计算在创建每个案例时打开的其他案例的数量。几个解决方案适用于小型数据集 20分钟在我的服务器与6 * 4GHz核心& 64GB内存。即使使用多核库，我也可以将时间减少 ..

发布时间：2017-03-12 10:48:01 r performance data.table dplyr vectorization 其他开发

运行长度的累积和。这个循环可以向量化吗？

我有一个数据框，我计算一个特定列的运行长度编码。列 dir 的值为-1,0或1。 dir.rle 然后，我将运行长度并计算另一列的分段累积和在数据帧中。我使用一个for循环，但我觉得应该有一个方法来做这更聪明。 ndx ..

发布时间：2017-03-12 10:32:41 r vectorization plyr data.table 其他开发

最快的方式来填充具有特定值的向量（SSE2）。模板友好

我有这个模板类： template ..

发布时间：2017-01-06 22:26:21 gcc copy initialization sse vectorization 开发方法

编译器错误，同时构建使用Eigen，C ++模板库的线性代数的项目

在我的项目中，当我为ARM NEON打开矢量化标志（mfpu = neon -mfloat-abi = softfp）时，我使用了线性代数的Eigen C ++库和 ONLY 获取编译器错误。我不能理解错了什么。我需要在Eigen库中为ARM NEON启用任何预处理器指令吗？ main.c ＃include #include ..

发布时间：2016-12-23 15:35:12 c++ compiler-errors arm vectorization neon C/C++开发

矢量化是什么意思？

这是一个好主意，向量化的代码？什么时候做什么是好的做法？下面会发生什么？解决方案矢量化意味着编译器检测到您的独立指令可以作为一个执行 SIMD 说明。通常的例子是，如果你对于（i = 0; i [i] = a [i] + b [i]; } 它将被矢量化为（使用向量符号） for（i = 0; i a [i：i + VF] [i：i + VF] + ..

发布时间：2016-12-22 21:13:00 c++ c gcc compiler-construction vectorization C/C++开发

vectorization相关内容