data.table相关内容
我很难使用data.table来总结向量函数的结果,这在ddply中很容易做到。 问题1:使用具有向量输出的(开销很大的)函数进行聚合 dt
..
在data.table的j参数中,是否有语法允许我在相同的j语句中引用以前创建的变量?我正在考虑类似于Lisp的let*构造的东西。 library(data.table) set.seed(22) DT
..
我很难理解setDT()函数的本质。当我阅读SO上的代码时,我经常遇到使用setDT()来创建data.table。当然,data.table()的用法无处不在。我觉得我确实理解了data.table()的本质,但setDT()的相关性却让我摸不着头脑。?setDT告诉我: setDT通过引用将列表(已命名和未命名)和数据帧转换为data.ables。 以及: 在data.tab
..
我有: > lst_A DT_result DT_result DT_result lst_B res
..
我正在尝试建立一个闪亮的应用程序,这是一个搜索引擎。 我根据搜索关键字返回一个data.table: DT
..
我有一个数据表,如下所示: PID vara90 vara91 vara92 vara93 varb90 varb91 varb92 varb93 1: 1 2 1 45 77 "Str1" "Str3" "Str3" "Str1" 2: 2 6 1 5 3
..
我正在处理一个表单的简单表格 date variable value 1970-01-01 V1 0.434 1970-01-01 V2 12.12 1970-01-01 V3 921.1 1970-01-02 V1 -1.10 1970-01-03 V3 0.000 19
..
我有一个数据框,如下所示: Name Start_Date End_Date A 2015-01-01 2019-12-29 A 2017-03-25 NA A 2019-10-17 NA A 2012-04-16 2015-01-09 A 2002-06-01 2006-02-01 A 2005-12-
..
我有一个此表单的数据表(2000000+行,1,000+组): set.seed(1) dt dt id values 1: 1 a 2: 1 c 3: 1 a
..
我有一个数据。表 library(data.table) DT DT a b x 1: 1 4 1 2: 2 4 3 3: 3 4 5 4: 4 4 5 我想选择x等于a或b的行。显然,我可以使用 > DT[x==a | x==b] a b x 1: 1
..
我在变异dplyr中的行子集时遇到问题。我使用CHAINING命令:%>%表示: data % filter(ColA == "ABC") %>% mutate(ColB = "XXXX") 这可以很好地工作,但问题是我希望能够选择整个原始表,并看到变体只应用于我指定的数据子集。我的问题是,在此之后查看数据时,我只能看到data及其更新的ColB信息的子集。
..
我正在寻找一种快速的方法来“不连接”(即保留未合并的行,或与内部连接相反的行)。我一直使用的方法是对X和Y使用data.table,然后设置关键点。例如: require(data.table) X
..
我想检查每行中的所有值是否都相同,但是,NA应该被忽略 MWe: library(data.table) DT=data.table(v1=c(1,2,3),v2=c(1,3,3), v3=c(NA,2,3)) DT v1 v2 v3 1: 1 1 NA 2: 2 3 2 3: 3 3 3 desired=c(T,F,T) desired [1] TRUE FA
..
我正在努力解决我有的一个特定问题,我搜索了stackoverflow,找到了接近但不完全是我想要的示例。 最接近的示例是here 此帖子(here)也很接近,但我无法使我的多输出函数与List()一起使用 我要做的是创建包含聚合值(MIN、MAX、Mean、MyFunc)并按键分组的表。 我还有一些返回多个输出的复杂函数。我可以返回单个输出,但这意味着要多次运行复杂的函数,并且会花费太
..
我再次努力理解在执行联接时更新时mult参数是如何工作的。 我要做的是实现lj中定义的左连接。 出于性能原因,我想更新左表 重要的是,当左表和右表有共同的列时(不考虑连接列),我想使用右表中的第一个值来覆盖左表的值。 我以为mult可以帮助我处理此多匹配问题,但我无法正确处理 library(data.table) X
..
嗨,我有一个面板数据集。我想对每家公司进行滚动窗口回归,并提取独立变量的系数。y是因变量,x是独立变量。滚动窗口是12。也就是说, 第一回归使用行1到行12的数据, 第二次回归使用第2行到第13行数据,依此类推。 使用了RollApply。 下面是一个与我遇到的错误完全相同的问题: Rolling by group in data.table R 这个问题幸运的是,它只需要一个专栏,而我的问题需
..
我有一个包含31557个观测值的数据集,变量为Order.Number和Material。我正在尝试在R: 中运行此命令 第一个: DT
..
假设我有两个 data.table: 答: A B1:1 122:2 133:3 144:4 15 乙: A B1:2 132:3 14 我有以下代码: merge_test = merge(dataA, dataB, by="A", all.data=TRUE) 我明白了: A B.x B.y1:2 13 132:3 14 14 但是,我想要最终合并表中 dataA
..
为了尝试提取下面两个数据框之间的不匹配,我已经设法创建了一个新的数据框,其中替换了不匹配. 我现在需要的是一个不匹配的列表: dfA
..
我有一个包含一些值('value')、下限('min_val')和上限('max_val')的 data.table: |价值 |min_val |最大值 |1:|94.001 |94.00 |94.02 |2:|94.002 |94.00 |94.03 |3:|94.003 |94.01 |94.04 |4:|95 |94.98 |95.02 | 我想计算 value > 的行数min_v
..