data.table相关内容

何时应该使用setDT()而不是data.table()来创建data.table?

我很难理解setDT()函数的本质。当我阅读SO上的代码时,我经常遇到使用setDT()来创建data.table。当然,data.table()的用法无处不在。我觉得我确实理解了data.table()的本质,但setDT()的相关性却让我摸不着头脑。?setDT告诉我: setDT通过引用将列表(已命名和未命名)和数据帧转换为data.ables。 以及: 在data.tab ..
发布时间:2022-06-24 20:23:05 其他开发

基于模糊标准创建组

我有一个数据框,如下所示: Name Start_Date End_Date A 2015-01-01 2019-12-29 A 2017-03-25 NA A 2019-10-17 NA A 2012-04-16 2015-01-09 A 2002-06-01 2006-02-01 A 2005-12- ..
发布时间:2022-04-16 12:56:28 其他开发

r如何变异行的子集

我在变异dplyr中的行子集时遇到问题。我使用CHAINING命令:%>%表示: data % filter(ColA == "ABC") %>% mutate(ColB = "XXXX") 这可以很好地工作,但问题是我希望能够选择整个原始表,并看到变体只应用于我指定的数据子集。我的问题是,在此之后查看数据时,我只能看到data及其更新的ColB信息的子集。 ..
发布时间:2022-03-14 13:20:19 其他开发

从返回多个输出的函数创建聚合输出data.table

我正在努力解决我有的一个特定问题,我搜索了stackoverflow,找到了接近但不完全是我想要的示例。 最接近的示例是here 此帖子(here)也很接近,但我无法使我的多输出函数与List()一起使用 我要做的是创建包含聚合值(MIN、MAX、Mean、MyFunc)并按键分组的表。 我还有一些返回多个输出的复杂函数。我可以返回单个输出,但这意味着要多次运行复杂的函数,并且会花费太 ..
发布时间:2022-03-02 22:35:56 其他开发

有人能解释一下当MULT在连接(使用.EACHI和MULT)中执行UPDATE时,MULT在data.table中是如何工作的吗

我再次努力理解在执行联接时更新时mult参数是如何工作的。 我要做的是实现lj中定义的左连接。 出于性能原因,我想更新左表 重要的是,当左表和右表有共同的列时(不考虑连接列),我想使用右表中的第一个值来覆盖左表的值。 我以为mult可以帮助我处理此多匹配问题,但我无法正确处理 library(data.table) X ..
发布时间:2022-02-28 18:52:33 其他开发

按组滚动回归

嗨,我有一个面板数据集。我想对每家公司进行滚动窗口回归,并提取独立变量的系数。y是因变量,x是独立变量。滚动窗口是12。也就是说, 第一回归使用行1到行12的数据, 第二次回归使用第2行到第13行数据,依此类推。 使用了RollApply。 下面是一个与我遇到的错误完全相同的问题: Rolling by group in data.table R 这个问题幸运的是,它只需要一个专栏,而我的问题需 ..
发布时间:2022-02-26 19:04:11 其他开发

使用 data.table 左连接

假设我有两个 data.table: 答: A B1:1 122:2 133:3 144:4 15 乙: A B1:2 132:3 14 我有以下代码: merge_test = merge(dataA, dataB, by="A", all.data=TRUE) 我明白了: A B.x B.y1:2 13 132:3 14 14 但是,我想要最终合并表中 dataA ..
发布时间:2022-01-30 22:32:57 其他开发