data.table相关内容

闪亮的反应性因data.tables而失败

作为 修改 a反应值应该触发一个观察块,我进一步调查了这个问题并意识到这个问题可能源于我对 data.tables 的使用.data.table 是通过引用来修改的,这与 data.frame 不同,这使得它们使用起来更高效,但对 shiny 的反应性显然不可见. 在下面的示例中,按下提交按钮会在 data.frame 情况下触发观察块,但在 data.table 情况下不会.一种解决方法可 ..
发布时间:2022-01-13 19:35:22 其他开发

data.table::fread 不喜欢第一列中的缺失值

这是 data.table::fread(版本 1.9.2)中的错误还是错误的用户期望/错误? 考虑这个简单的例子,我有一个值表,TAB 用可能缺失的值分隔.如果第一列中缺少值, fread 会感到不安,但如果在其他地方缺少值,我会返回 data.table 我期望: # 第一列第三行最后一列第二行有缺失值的数据:12 876 1923 3915 20fread("12 876 1923 ..
发布时间:2022-01-13 19:34:47 其他开发

在 R 中制作一个依赖于 data.table 的包

我必须制作一个依赖包data.table的R包.但是,如果我要做一个功能,例如包中的下一个功能 randomdt 0]} 函数 [ 将使用 data.frame 的方法而不是 data.table 的方法,因此会出错 `[.data.frame`(x, i) 中的错误:选择了未定义的 ..
发布时间:2022-01-13 19:34:39 其他开发

使用 fread 读取对齐的列数据

我遇到了这样的文件: COL1 COL2 COL3weqw asrg qerhqetjwweweg ethweth rqerhwrtjwrhqerhqerhq qergqer qerhqew5hqerh qergqer wetjwryerj 我无法直接用 fread 加载它,所以我将 \s+ 替换为 , 与 sed 比我交给 fread 并解决了它.但是有没有一种内置的方式来使用 data.t ..
发布时间:2022-01-13 19:34:30 其他开发

data.table - 按除一列之外的所有内容分组

我可以使用 data.table 按除一列之外的所有列进行分组吗?我有很多列,所以我宁愿避免写出所有的 colnames. 原因是我想折叠表格中的重复项,我知道其中一列没有相关性. 库(data.table)DT 也就是说,给定 DT,是否有类似 DT[, print(.SD), by = !collapse] 的东西: >DT[, 打印(.SD), .(N, val)]坍塌1:一个 ..
发布时间:2022-01-13 19:34:25 其他开发

R data.table v1.9.6 中的错误 - 函数“fread";

我最近更新到data.table 1.9.6,使用fread时出现如下错误: fread("Aug14.csv")fread("Aug14.csv") 中的错误:4 个参数传递给 .Internal(nchar) 需要 3 个 另一个帖子在另一个上下文中讨论了这个错误,但在升级到 data.table 1.9.6 之前它工作得很好.有什么建议吗? 这是我的设置: sessionInf ..
发布时间:2022-01-13 19:34:16 其他开发

R 数据表复制和修改更改原始数据表

当我复制一个 data.table 并修改新的表时,原来的表会被更改,我无法找出一个.这是正常行为吗? dt = data.table(zone=1:5, pc=11:15)dt = dtdtt[, pc := pc*2 ]dtt专区电脑1:1 222:2 243:3 264:4 285:5 30dt专区电脑1:1 222:2 243:3 264:4 285:5 30 更明确地创建新的data ..
发布时间:2022-01-13 19:34:02 其他开发

具有多个分类条件的 R 中的 Ifelse

我有一个数据集 dt.train2 有 1500 个不同的观察值和 130 个变量.其中之一是languages,它可以是english、french、arabic... 我想创建一个 ifelse 字符串,它为 english 提供属性 1,为 提供 2法语,3 用于spanish 和0 用于其他任何内容.我不知道该怎么做. dt.train2[, language_string := ..
发布时间:2022-01-13 19:33:53 其他开发

我的 group by 似乎没有在磁盘框架中工作

我在一个大型数据集 (>20GB) 上运行了一个 group by,但它似乎工作不正常 这是我的代码 mydf[, .(value = n_distinct(list_of_id, na.rm = T)),按 = .(周),keep = c("list_of_id", "week")] 它返回了这个错误 警告消息:1:在序列化(数据,节点$con)中: 'package:MLme ..
发布时间:2022-01-13 19:33:43 其他开发

基于列值重复的函数的 R 函数

我有一个需要进行字符串匹配的大型数据集.我从这个站点获得了一些非常有用的帖子,并引用它们我创建了一个函数来为我的数据集进行字符串匹配.我正在粘贴我的示例数据和代码. 样本数据 Address1 代码 fn.fuzzymatch 这适用于国家/地区级别的数据,但是我在区域级别有多个数据文件,并且每个区域都有多个区域.每个区域的区号可通过 data1 中的 AREACODE 变量和 d ..
发布时间:2022-01-13 19:33:34 其他开发

R - 快速二样本 t 检验

我想使用单独的分组在 R 中执行两个样本 t 检验.t.test 必须是“无偏的",这意味着对于外部组(下面的第 2 组)中的所有事务,必须为每个内部组(下面的第 1 组)运行 T 测试,例如:“内部组 A"与“内部组不是 A".下面显示的 for 循环代码可能比口头解释更清楚... 我当前的代码如下.有谁知道更快/更好的方法来做到这一点?可以使用任何包,但目前使用的是 data.table ..
发布时间:2022-01-13 19:33:26 其他开发

根据列标准以编程方式从 Data.table 中选择行

我有一个关于如何根据列中的值以编程方式从 data.table 中选择行的问题. 假设我有下面的 Data.table 库(data.table)DT 现在我想选择 y = 3 和 v = 2 的行 通常我可以使用下面的代码 >DT[y==3&v==2]x y v1:一 3 2 但在我的情况下,这样的选择标准本身就是一个变量,并放入不同的 DF >DF = data.fra ..
发布时间:2022-01-13 19:33:20 其他开发

R - 如何为唯一组序列的缺失值添加行?

我的问题与上一个问题类似 在data.frame中为缺失值添加行的最快方法? 当最小/最大值因组而异时,我不知道如何添加用“NA"填充的行. >red 我希望它看起来像: 项目周期 v3 v46 1个红色6 2 b 黄色6 3 不适用 不适用6 4 不适用 不适用6 5 c 红色6 6 d 黄色6 7 e 红色9 2 f 黄色9 3 不适用 不适用9 4克 红色9 5 小时 黄色 当 ..
发布时间:2022-01-13 19:32:57 其他开发

具有多个变量输入的 R 自定义 data.table 函数

我正在使用 data.table (v 1.9.6) 编写一个自定义聚合函数,并且很难将函数参数传递给它.对此也有类似的问题,但没有一个涉及多个(可变)输入,而且似乎没有一个结论性的答案,而是“小技巧". 将变量和名称传递给 data.table 函数 在 data.table 中评估和引用 如何在 R 中的 data.table 中使用变量中的列名完全通用地工作 我想获取一个数据 ..
发布时间:2022-01-13 19:32:49 其他开发

最后一个下划线后的分隔字符串

这确实是这个问题的重复r-split-string-using-tidyrseparate,但我无法使用 MWE目的,因为我不知道如何调整正则表达式.我基本上想要同样的东西,但在最后一个下划线之后拆分变量. 原因:我的数据中某些列针对相同的因子/类型多次显示.我想我可以将数据融合在类型字符串之前将值变量分开,然后将其再次展开为具有较少列的宽格式.我的问题是我的变量名有几个不同的下划线,我想学 ..
发布时间:2022-01-13 19:32:29 其他开发