我的 group by 似乎没有在磁盘框架中工作 [英] My group by doesn't appear to be working in disk frames

查看：25 发布时间：2022/1/13 19:33:43 r data.table disk.frame

本文介绍了我的 group by 似乎没有在磁盘框架中工作的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我在一个大型数据集 (>20GB) 上运行了一个 group by，但它似乎工作不正常

I ran a group by on a large dataset (>20GB) and it doesn't appear to be working quite right

这是我的代码

mydf[, .(value = n_distinct(list_of_id, na.rm = T)),
                      by = .(week),
                      keep = c("list_of_id", "week")
                      ]

它返回了这个错误

警告消息:1:在序列化(数据，节点$con)中:
'package:MLmetrics' 可能在加载 2 时不可用:在serialize(data, node$con) : 'package:MLmetrics' 可能不可用加载 3 时:在 serialize(data, node$con) 中:'package:MLmetrics'加载时可能不可用 4: In serialize(data, node$con) :
加载 5 时，package:MLmetrics"可能不可用:在serialize(data, node$con) : 'package:MLmetrics' 可能不可用加载 6 时:在 serialize(data, node$con) 中:'package:MLmetrics'加载时可能不可用 7: In serialize(data, node$con) :
'package:MLmetrics' 可能在加载 8 时不可用:在serialize(data, node$con) : 'package:MLmetrics' 可能不可用加载时

Warning messages: 1: In serialize(data, node$con) :
'package:MLmetrics' may not be available when loading 2: In serialize(data, node$con) : 'package:MLmetrics' may not be available when loading 3: In serialize(data, node$con) : 'package:MLmetrics' may not be available when loading 4: In serialize(data, node$con) :
'package:MLmetrics' may not be available when loading 5: In serialize(data, node$con) : 'package:MLmetrics' may not be available when loading 6: In serialize(data, node$con) : 'package:MLmetrics' may not be available when loading 7: In serialize(data, node$con) :
'package:MLmetrics' may not be available when loading 8: In serialize(data, node$con) : 'package:MLmetrics' may not be available when loading

我最初加载了库，但在运行此代码之前我运行了 remove.packages(MLmetrics).此外，我检查了 conflicted::conflict_scout 并没有与包 MLmetrics 出现任何冲突.

I had initially loaded the library but then I ran remove.packages(MLmetrics) before running this code. Additionally, I checked conflicted::conflict_scout and there aren't any conflicts that show up with the package MLmetrics.

当我运行这段代码时

> mydf %>% 
+   filter(week == "2012-01-02")

它给了我这个输出

         week    value 
1: 2012-01-02      483     
2: 2012-01-02     61233

我担心它在对数据进行分组时出现问题，因为它没有创建价值周的不同组.两列都存储为数据类型字符.

I'm concerned that something went wrong when it was grouping the data since it didn't create distinct groups of the value week. Both columns are stored as data types character.

我的 group by 似乎没有在磁盘框架中工作 [英] My group by doesn't appear to be working in disk frames

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

我的 group by 似乎没有在磁盘框架中工作 [英] My group by doesn&#39;t appear to be working in disk frames

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

我的 group by 似乎没有在磁盘框架中工作 [英] My group by doesn't appear to be working in disk frames

登录关闭