data.table相关内容

选择列序列:`:` 有效,但 `seq` 无效

我正在尝试通过从 data.table 中选择一些列来对数据集进行子集化.但是,我的代码不适用于某些变体. 这是一个示例数据表 库(data.table)DT 这是一个工作子集代码,其中列的数字序列使用 :: DT[ , 1:2] 但是,使用 seq 指定 same 列序列不起作用: DT[ , seq(1:2)] 请注意,这适用于数据框,但不适用于 data.table. ..
发布时间:2022-01-13 19:19:16 其他开发

R:如何判断Date在同一周?

我想创建一个新的列来表示同一周内的日期. data.table DATE_SET 包含日期信息,如: DATA_SET 例如,“2017-03-01"和“2017-03-02"在同一周,“2017-03-01"和“2017-03-08"都在星期三,但它们不在同一周. 如果“2016-01-01"是2016年的第一周,“2017-01-01"是2017年的第一周,值为1,但它们不在同 ..
发布时间:2022-01-13 19:18:59 其他开发

R 中的非等值连接与 data.table - 反引号列名问题

当(反引号的)列名包含空格时,我无法使用 data.table 进行非等连接. 我在工作时从我们的数据库中收集这些名字,我们的明确政策是让每个人都使用这些相同的名字以避免混淆.我当然可以转换和重新转换,但我宁愿避免这种情况. 我想知道,这是否是 data.table 中的一个故障,如果是这样,可以补救吗?还是我错过了什么?我对 R 很陌生,所以后者完全有可能...... 一个可重 ..
发布时间:2022-01-13 19:18:45 其他开发

在 r 中的 data.table 中缩放

LC RC TOEIC eua 再课1:490 390 880 90 0 1008182:495 395 890 90 0 1008183:490 330 820 90 0 1008184:495 460 955 96 0 1008185:495 370 865 91 0 100818---1021:470 400 870 61 0 1007701022:260 180 440 48 0 100 ..
发布时间:2022-01-13 19:18:16 其他开发

在 data.table 中对因子水平进行分组

我正在尝试在 data.table &想知道是否有 data.table-y 方法可以这样做. 例子: DT = data.table(id = 1:20, ind = as.factor(sample(8, 20, replace = TRUE))) 我想说类型 1,3,8 属于 A 组;2和4在B组;和5,6,7在C组. 这是我一直在做的,在问题的完整版中相当慢: DT[in ..
发布时间:2022-01-13 19:17:59 其他开发

data.table 连接 - 选择 i 参数中的所有列

加入两个data.table我可以指定我想要列的表,比如 X[Y, i.id] # `id` 取自 Y 我的问题是我有一个大约 80 列的大桌子.每天晚上都会发生一次数据刷新,根据某些参数,某些行会被新版本的表替换(同一张表,只是新数据). 当前 ..
发布时间:2022-01-13 19:17:38 其他开发

R:在可行的情况下快速(条件)子集

我想对我的数据行进行子集化 库(data.table);set.seed(333);n 分几个阶段.我知道我可以按顺序应用 subset(.) 来实现这一点. >s 119)>s 219)>子集(s,z>315)编号 x y z1:55 119.2634 219.0044 315.6556 我的问题是我需要自动执行此操作,并且子集可能为空. ..
发布时间:2022-01-13 19:17:24 其他开发

为什么“性格往往比因素更受欢迎"?在 data.table 中作为键?

来自 data.table 手册: 事实上我们非常喜欢 data.table 包含一个计数排序使用 R 的内部全局字符串的字符向量算法缓存.这对于包含许多字符的字符向量特别快重复项,例如键列中的分组数据.这意味着性格往往比因素更受欢迎.因素仍充分支持,特别是有序因子(水平不在字母顺序). factor 不是应该比 character 更容易counting sort 的整数吗? ..
发布时间:2022-01-13 19:17:15 其他开发

仅对非 NA 元素求和,但如果所有 NA 则返回 NA

我想我已经在评论中得到了很好的答案,但我会改写问题以供将来参考. 我正在尝试使用 data.table 按组求和.问题是某些组只有有 NA.对于这些组,我希望总和返回 NA.但是,如果有一组的值与 NA 不同,我想得到非 NA 值的总和. A ..
发布时间:2022-01-13 19:17:09 其他开发

data.table 列的类

我想知道如何在给定字符向量 w 的情况下确定 data.table dt 中列的类别. 可重现的例子: dt 但是,将其指定为字符向量,它会返回一列 data.table: >dt[,w,with=FALSE]V11:12:2>类(dt[,w,with=FALSE])[1] “data.table" “data.frame" 我已经尝试了以下解决方案,但肯定有更好的方法: dt[ ..
发布时间:2022-01-13 19:16:55 其他开发

将两个日期之间的行生成到 R 中的数据框中

我刚开始学习 R 的时间很短.我有下表 名称 stDte edDte2010-05-01 2014-12-01B 2013-06-01 2014-02-01 我需要把它变成这样的表格 名称 Dte2010-05-012010-06-012010-07-01...2014-12-01B 2013-06-01B 2013-07-01...2014-02-01 我正在考虑将“for"循环与 rb ..
发布时间:2022-01-13 19:16:27 其他开发

unique.data.table 选择最后一行代替第一行

在键控 data.table 上调用 unique 您将在每个组中拥有唯一的行.如果有重复的行,将采用第一行.当我需要最后一个而不是(通常是最后一个临时事务)时,我使用 .SD[.N] 库(data.table)库(微基准)dt 你知道更快的方法吗? 解决方案 创建一个 data.table,其中包含关键变量的唯一组合,然后使用 mult = 'last' 使用 .SD 很方便 ..
发布时间:2022-01-13 19:16:20 其他开发

R将多行折叠成1行-相同的列

这是对我昨晚回答的一个问题的支持,因为我正在重新考虑如何格式化我的数据.我进行了搜索,但找不到任何适用的答案;我可能使用错误的字词进行搜索. 我有一个包含许多行的数据表,我想合并它们: record_numb ..
发布时间:2022-01-13 19:15:57 其他开发

R data.table 条件聚合

我面临(我认为)是 data.table 上的聚合的棘手问题我有以下 data.table 结构(列表(id1 = c(“a",“a",“a",“b",“b",“c",“c"),id2 = c(“x",“y"、“z"、“x"、“u"、“y"、“z"),val = c(2、1、2、1、3、4、3)),.Names = c("id1","id2", "val"), row.names = c(NA, ..
发布时间:2022-01-13 19:15:41 其他开发

从 R data.table 中的每一列中减去每一列

假设我有一个 data.table set.seed(1) # 使示例可重现ex 我想从列 AAA 中减去每隔一列,然后从 BBB 中减去每个剩余的列(FLAG 除外),依此类推,以使输出看起来像... ex[,list(AAA_BBB=AAA-BBB,AAA_CCC=AAA-CCC,AAA_DDD=AAA-DDD,BBB_CCC=BBB-CCC,BBB_DDD=BBB-DDD,CCC_DD ..
发布时间:2022-01-13 19:15:33 其他开发