data.table相关内容
我正在尝试通过从 data.table 中选择一些列来对数据集进行子集化.但是,我的代码不适用于某些变体. 这是一个示例数据表 库(data.table)DT 这是一个工作子集代码,其中列的数字序列使用 :: DT[ , 1:2] 但是,使用 seq 指定 same 列序列不起作用: DT[ , seq(1:2)] 请注意,这适用于数据框,但不适用于 data.table.
..
我有什么方法可以避免在 R 中对矩阵进行就地修改时复制时复制? 我正在尝试将一个较小的矩阵复制到一个较大的矩阵切片中,如下所示. 库(data.table)y
..
我想创建一个新的列来表示同一周内的日期. data.table DATE_SET 包含日期信息,如: DATA_SET 例如,“2017-03-01"和“2017-03-02"在同一周,“2017-03-01"和“2017-03-08"都在星期三,但它们不在同一周. 如果“2016-01-01"是2016年的第一周,“2017-01-01"是2017年的第一周,值为1,但它们不在同
..
当(反引号的)列名包含空格时,我无法使用 data.table 进行非等连接. 我在工作时从我们的数据库中收集这些名字,我们的明确政策是让每个人都使用这些相同的名字以避免混淆.我当然可以转换和重新转换,但我宁愿避免这种情况. 我想知道,这是否是 data.table 中的一个故障,如果是这样,可以补救吗?还是我错过了什么?我对 R 很陌生,所以后者完全有可能...... 一个可重
..
LC RC TOEIC eua 再课1:490 390 880 90 0 1008182:495 395 890 90 0 1008183:490 330 820 90 0 1008184:495 460 955 96 0 1008185:495 370 865 91 0 100818---1021:470 400 870 61 0 1007701022:260 180 440 48 0 100
..
我想获取一个介于多个范围之间的值的列表. 库(data.table)值
..
我正在尝试在 data.table &想知道是否有 data.table-y 方法可以这样做. 例子: DT = data.table(id = 1:20, ind = as.factor(sample(8, 20, replace = TRUE))) 我想说类型 1,3,8 属于 A 组;2和4在B组;和5,6,7在C组. 这是我一直在做的,在问题的完整版中相当慢: DT[in
..
加入两个data.table我可以指定我想要列的表,比如 X[Y, i.id] # `id` 取自 Y 我的问题是我有一个大约 80 列的大桌子.每天晚上都会发生一次数据刷新,根据某些参数,某些行会被新版本的表替换(同一张表,只是新数据). 当前
..
我的数据集如下所示: 库(data.table)df 我想创建一个具有非空列名称的新列.结果将是: df_result
..
我想对我的数据行进行子集化 库(data.table);set.seed(333);n 分几个阶段.我知道我可以按顺序应用 subset(.) 来实现这一点. >s 119)>s 219)>子集(s,z>315)编号 x y z1:55 119.2634 219.0044 315.6556 我的问题是我需要自动执行此操作,并且子集可能为空.
..
来自 data.table 手册: 事实上我们非常喜欢 data.table 包含一个计数排序使用 R 的内部全局字符串的字符向量算法缓存.这对于包含许多字符的字符向量特别快重复项,例如键列中的分组数据.这意味着性格往往比因素更受欢迎.因素仍充分支持,特别是有序因子(水平不在字母顺序). factor 不是应该比 character 更容易counting sort 的整数吗?
..
我想我已经在评论中得到了很好的答案,但我会改写问题以供将来参考. 我正在尝试使用 data.table 按组求和.问题是某些组只有有 NA.对于这些组,我希望总和返回 NA.但是,如果有一组的值与 NA 不同,我想得到非 NA 值的总和. A
..
我有两个数据表: 库(data.table)d1 我执行非 equi 连接,其中 'd1' 中的值 'val' 应落在 'd2' 中的 'from' 和 'to' 为每个组 'grp' 定义的范围内. d1[d2, on = .(grp, val >= from, val
..
我想知道如何在给定字符向量 w 的情况下确定 data.table dt 中列的类别. 可重现的例子: dt 但是,将其指定为字符向量,它会返回一列 data.table: >dt[,w,with=FALSE]V11:12:2>类(dt[,w,with=FALSE])[1] “data.table" “data.frame" 我已经尝试了以下解决方案,但肯定有更好的方法: dt[
..
我刚开始学习 R 的时间很短.我有下表 名称 stDte edDte2010-05-01 2014-12-01B 2013-06-01 2014-02-01 我需要把它变成这样的表格 名称 Dte2010-05-012010-06-012010-07-01...2014-12-01B 2013-06-01B 2013-07-01...2014-02-01 我正在考虑将“for"循环与 rb
..
在键控 data.table 上调用 unique 您将在每个组中拥有唯一的行.如果有重复的行,将采用第一行.当我需要最后一个而不是(通常是最后一个临时事务)时,我使用 .SD[.N] 库(data.table)库(微基准)dt 你知道更快的方法吗? 解决方案 创建一个 data.table,其中包含关键变量的唯一组合,然后使用 mult = 'last' 使用 .SD 很方便
..
这是对我昨晚回答的一个问题的支持,因为我正在重新考虑如何格式化我的数据.我进行了搜索,但找不到任何适用的答案;我可能使用错误的字词进行搜索. 我有一个包含许多行的数据表,我想合并它们: record_numb
..
我面临(我认为)是 data.table 上的聚合的棘手问题我有以下 data.table 结构(列表(id1 = c(“a",“a",“a",“b",“b",“c",“c"),id2 = c(“x",“y"、“z"、“x"、“u"、“y"、“z"),val = c(2、1、2、1、3、4、3)),.Names = c("id1","id2", "val"), row.names = c(NA,
..
假设我有一个 data.table set.seed(1) # 使示例可重现ex 我想从列 AAA 中减去每隔一列,然后从 BBB 中减去每个剩余的列(FLAG 除外),依此类推,以使输出看起来像... ex[,list(AAA_BBB=AAA-BBB,AAA_CCC=AAA-CCC,AAA_DDD=AAA-DDD,BBB_CCC=BBB-CCC,BBB_DDD=BBB-DDD,CCC_DD
..
为什么这不适用于 data.table? 它适用于 data.frame.有没有办法用数据表做到这一点? x 这会返回: v1 v2 v3 v4真 真 真 假 解决方案 data.table 需要 with=FALSE 来获取列号. tokeep
..