data.table相关内容

如何从日期获取周数?

在R中寻找一个函数将日期转换为周数(一年)我从包中周 data.table 。 然而,我观察到一些奇怪的行为: >周(“2014-03-16”)#Sun,expecting 11 [1] 11 > week(“2014-03-17”)#Mon,expecting 12 [1] 11 > week(“2014-03-18”)#Tue,expecting 12 [1] 12 ..
发布时间:2017-03-12 11:32:20 其他开发

聚合在80K以上的唯一ID

关于大数据的另一个新手问题。我使用一个大数据集(3.5m行)与时间序列数据。我想用一个列创建一个 data.table ,该列首次找到唯一标识符。 df是一个 data.table , df $ timestamp 是 POSIXct 类中的日期, df $ id 是唯一的数字标识符。我使用以下代码: #UPDATED - 数据键 setkey(df,id) sub_df ..
发布时间:2017-03-12 11:32:08 其他开发

滞后于数据表

目前我有一个效用函数 lags 在 data.table 中按组。函数很简单: panel_lag 0 ){ #使过去的值向前k倍 return(c(rep(NA,k),head(var,-k))) } else { #未来值向后 return(c(tail(var,k),rep(NA,-k))) } } pre> ..
发布时间:2017-03-12 11:31:12 其他开发

R快速单项查找从列表vs data.table对哈希

我经常面临的一个问题是需要从data.table中查找任意行。我昨天遇到了一个问题,我试图加快一个循环,并使用 profvis 我发现从 data.table 是循环中最昂贵的部分。然后我决定尝试找到在R中执行单个项目查找的最快方法。 数据通常采用数据的形式。表,其中包含字符类型的键列。其余列通常是数值。我试图创建一个随机表,具有类似的特性,我经常处理,意味着> 100K行。我比较了原生列表 ..
发布时间:2017-03-12 11:31:00 其他开发

确定data.frame的列何时更改值和更改的返回索引

我试图找到一种方法来确定一组列在数据框架中何时更改值。让我直截了当,请考虑以下示例: x x [4, = 6 cnt列是唯一的ID ,或时间列,为了简单起见,这里是一个int) 代码列就像一组行的代码(想象几个这样的组,但是具有不同的代码)。 val0,val1,val2列就像是分数。 上面的data.frame应该被理解为:'ELEM ..
发布时间:2017-03-12 11:30:37 其他开发

在data.table中取消列出嵌套列表列

在data.table中取消列出嵌套列表列。假设所有列表元素都是相同类型。列表元素被命名,名称也必须被处理。 它与 data.table聚合到列列。 我认为值得在SO data.table 知识库。 我目前的解决方法如下, m寻找一些更正规的答案。 (data.table) dt ..
发布时间:2017-03-12 11:30:25 其他开发

将date用于data.table包

我最近发现了data.table包,现在想知道是否应该替换我的一些plyr代码。总之,我真的很喜欢plyr,我基本上实现了我想要的一切。但是,我的代码运行一段时间,加速的事情的前景足以让我运行一些测试。这些测试很快就结束了,这就是原因。 我经常使用plyr做的是用包含日期的列分割我的数据,并做一些计算: p> library(plyr) DF #分割数据并应用任意函数 ddply ..
发布时间:2017-03-12 11:29:49 其他开发

在Excel中快速查看R data.frame,vector或data.table

如何在Excel中快速打开小的R表/向量对象? 例如,假设您想在Excel中查看以下三个对象: / p> ##带有逗号和引号的数据框 df = data.frame( area = unname state.x77 [,'Area']), frost = unname(state.x77 [,'Frost']), comments =“确定访问,但不想住在那里“, chal ..
发布时间:2017-03-12 11:29:23 其他开发

在“group by”中设置列名称操作与data.table

我是R的 data.table 包的新用户。 我试图给一个由“group by”命令创建的新列命名。 DT = data.table(x = rep(c(“a”,“b”),c(2,3)),y = 1:5) & DT xy 1:a 1 2:a 2 3:b 3 4:b 4 5:b 5 ; DT [,{z = sum(y); z + 3},by = x] x V1 ..
发布时间:2017-03-12 11:29:09 其他开发

如何在tm字典中实现接近规则以计数字?

目标 我想计算文档中出现“love”一词的次数, t前面加上“不”字“我爱电影”将被视为一个外观,而“我不爱电影”不会被视为外观。 问题 如何继续使用tm软件包? R代码 下面是一些自我包含的代码,我想修改做以上。 require(tm) #文本向量 my.docs< ; - c(“我爱红辣椒,他们是世界上最可爱的人”, “我不喜欢红辣椒,但我也 ..
发布时间:2017-03-12 11:28:44 其他开发