data.table - IT屋-程序员软件开发技术分享社区

使用向量函数的数据表聚合，取2

我很难使用data.table来总结向量函数的结果，这在ddply中很容易做到。问题1：使用具有向量输出的(开销很大的)函数进行聚合 dt ..

发布时间：2022-09-03 16:04:41 r data.table plyr dplyr 其他开发

是否可以在同一个`j`参数中使用`j`中新创建的变量？

在data.table的j参数中，是否有语法允许我在相同的j语句中引用以前创建的变量？我正在考虑类似于Lisp的let*构造的东西。 library(data.table) set.seed(22) DT ..

发布时间：2022-06-24 20:30:30 r data.table 其他开发

何时应该使用setDT()而不是data.table()来创建data.table？

我很难理解setDT()函数的本质。当我阅读SO上的代码时，我经常遇到使用setDT()来创建data.table。当然，data.table()的用法无处不在。我觉得我确实理解了data.table()的本质，但setDT()的相关性却让我摸不着头脑。?setDT告诉我： setDT通过引用将列表(已命名和未命名)和数据帧转换为data.ables。以及：在data.tab ..

发布时间：2022-06-24 20:23:05 r data.table 其他开发

R-测试字符串向量是否包含另一个列表的任何元素

我有： > lst_A DT_result DT_result DT_result lst_B res ..

发布时间：2022-06-10 23:08:24 r string data.table grepl contain 其他开发

R数据。带有逻辑与的表%LIKE%

我正在尝试建立一个闪亮的应用程序，这是一个搜索引擎。我根据搜索关键字返回一个data.table： DT ..

发布时间：2022-05-23 22:15:19 r data.table sql-like 其他开发

如何将数据表化成以年后缀为变量列的人年？

我有一个数据表，如下所示： PID vara90 vara91 vara92 vara93 varb90 varb91 varb92 varb93 1: 1 2 1 45 77 "Str1" "Str3" "Str3" "Str1" 2: 2 6 1 5 3 ..

发布时间：2022-04-18 12:44:08 r data.table reshape 其他开发

R中最快的高-宽旋转

我正在处理一个表单的简单表格 date variable value 1970-01-01 V1 0.434 1970-01-01 V2 12.12 1970-01-01 V3 921.1 1970-01-02 V1 -1.10 1970-01-03 V3 0.000 19 ..

发布时间：2022-04-18 12:29:07 r sqlite data.table plyr reshape 数据库

基于模糊标准创建组

我有一个数据框，如下所示： Name Start_Date End_Date A 2015-01-01 2019-12-29 A 2017-03-25 NA A 2019-10-17 NA A 2012-04-16 2015-01-09 A 2002-06-01 2006-02-01 A 2005-12- ..

发布时间：2022-04-16 12:56:28 r data.table igraph 其他开发

根据前面的值按组替换值序列

我有一个此表单的数据表(2000000+行，1,000+组)： set.seed(1) dt dt id values 1: 1 a 2: 1 c 3: 1 a ..

发布时间：2022-03-28 21:01:53 r string replace data.table sequence 其他开发

使用%中的%来子集data.table

我有一个数据。表 library(data.table) DT DT a b x 1: 1 4 1 2: 2 4 3 3: 3 4 5 4: 4 4 5 我想选择x等于a或b的行。显然，我可以使用 > DT[x==a | x==b] a b x 1: 1 ..

发布时间：2022-03-14 13:26:05 r data.table subset 其他开发

r如何变异行的子集

我在变异dplyr中的行子集时遇到问题。我使用CHAINING命令：%>%表示： data % filter(ColA == "ABC") %>% mutate(ColB = "XXXX") 这可以很好地工作，但问题是我希望能够选择整个原始表，并看到变体只应用于我指定的数据子集。我的问题是，在此之后查看数据时，我只能看到data及其更新的ColB信息的子集。 ..

发布时间：2022-03-14 13:20:19 r data.table subset dplyr 其他开发

未加入R中的&Q；(&Q；)

我正在寻找一种快速的方法来“不连接”(即保留未合并的行，或与内部连接相反的行)。我一直使用的方法是对X和Y使用data.table，然后设置关键点。例如： require(data.table) X ..

发布时间：2022-03-13 12:52:14 r merge inner-join data.table outer-join 其他开发

检查一行中的所有值是否都相同或为NA的最有效方法

我想检查每行中的所有值是否都相同，但是，NA应该被忽略 MWe： library(data.table) DT=data.table(v1=c(1,2,3),v2=c(1,3,3), v3=c(NA,2,3)) DT v1 v2 v3 1: 1 1 NA 2: 2 3 2 3: 3 3 3 desired=c(T,F,T) desired [1] TRUE FA ..

发布时间：2022-03-04 19:55:59 r dplyr filter data.table row 其他开发

从返回多个输出的函数创建聚合输出data.table

我正在努力解决我有的一个特定问题，我搜索了stackoverflow，找到了接近但不完全是我想要的示例。最接近的示例是here 此帖子(here)也很接近，但我无法使我的多输出函数与List()一起使用我要做的是创建包含聚合值(MIN、MAX、Mean、MyFunc)并按键分组的表。我还有一些返回多个输出的复杂函数。我可以返回单个输出，但这意味着要多次运行复杂的函数，并且会花费太 ..

发布时间：2022-03-02 22:35:56 r group-by data.table aggregate 其他开发

有人能解释一下当MULT在连接(使用.EACHI和MULT)中执行UPDATE时，MULT在data.table中是如何工作的吗

我再次努力理解在执行联接时更新时mult参数是如何工作的。我要做的是实现lj中定义的左连接。出于性能原因，我想更新左表重要的是，当左表和右表有共同的列时(不考虑连接列)，我想使用右表中的第一个值来覆盖左表的值。我以为mult可以帮助我处理此多匹配问题，但我无法正确处理 library(data.table) X ..

发布时间：2022-02-28 18:52:33 r join data.table left-join 其他开发

按组滚动回归

嗨，我有一个面板数据集。我想对每家公司进行滚动窗口回归，并提取独立变量的系数。y是因变量，x是独立变量。滚动窗口是12。也就是说，第一回归使用行1到行12的数据，第二次回归使用第2行到第13行数据，依此类推。使用了RollApply。下面是一个与我遇到的错误完全相同的问题： Rolling by group in data.table R 这个问题幸运的是，它只需要一个专栏，而我的问题需 ..

发布时间：2022-02-26 19:04:11 r data.table regression rollapply rolling-computation 其他开发

对分组DT进行梳理返回错误"；n<；m"；

我有一个包含31557个观测值的数据集，变量为Order.Number和Material。我正在尝试在R：中运行此命令第一个： DT ..

发布时间：2022-02-23 22:40:38 r dataframe data.table correlation combn 其他开发

使用 data.table 左连接

假设我有两个 data.table: 答: A B1:1 122:2 133:3 144:4 15 乙: A B1:2 132:3 14 我有以下代码: merge_test = merge(dataA, dataB, by="A", all.data=TRUE) 我明白了: A B.x B.y1:2 13 132:3 14 14 但是，我想要最终合并表中 dataA ..

发布时间：2022-01-30 22:32:57 r join merge data.table 其他开发

如何比较两个数据框/表并在 R 中提取数据?

为了尝试提取下面两个数据框之间的不匹配，我已经设法创建了一个新的数据框，其中替换了不匹配. 我现在需要的是一个不匹配的列表: dfA ..

发布时间：2022-01-25 09:17:01 r dataframe compare data.table mismatch 其他开发

我有一个包含一些值('value')、下限('min_val')和上限('max_val')的 data.table: |价值 |min_val |最大值 |1:|94.001 |94.00 |94.02 |2:|94.002 |94.00 |94.03 |3:|94.003 |94.01 |94.04 |4:|95 |94.98 |95.02 | 我想计算 value > 的行数min_v ..

发布时间：2022-01-24 20:17:08 r dataframe performance data.table range 其他开发

data.table相关内容