dplyr相关内容

在Spaklyr中创建虚拟变量?

我正在尝试扩展我的一些ML管道,我喜欢Spaklyr打开的RStudio、Spark和H2O的组合(http://spark.rstudio.com/) 我想弄明白的一件事是如何使用Spaklyr从数据帧中的字符向量创建伪COL。 我已经尝试了下面的方法,但我认为它可能混合了一些Spaklyr尚未实现的功能。 library(sparklyr) library(dplyr) s ..
发布时间:2022-09-03 16:22:44 其他开发

在R的市场上遇到了网络刮硬币的麻烦

我正试图从名为CoinMarkets&的网站上获取加密货币的历史价格,但我做不到。我知道有很多关于这个话题的帖子,我几乎尝试了所有的帖子,但所有的方法对我都不起作用。我使用的是Windows10,我尝试了检查方法。我哪里做错了?我的代码是: dataurl = "https://coinmarketcap.com/currencies/bitcoin/historical-data/" d ..
发布时间:2022-09-02 18:53:56 前端开发

Dplyr:计算汇总组之间的百分比变化

我正在尝试计算组之间的变化百分比,其中有一个对照和几个处理,在我的数据框中被组织为组。因为我有很多观察,所以我使用dplyr。我不明白的是,如何有效地设定与哪一组进行比较?通常,我会将此任务分成多个步骤: 分组计算平均值 子集控制组以创建新的“控件”数据帧 将“控制”数据帧联接到第一个DF 计算对照和处理之间的变化百分比。 不过,我想知道dplyr是否已经有了一个更简单、更直截了 ..
发布时间:2022-09-02 16:29:07 其他开发

使用带有r-shiny的ggploy时出错(警告:中的错误:`Filter()`输入`..1`有问题。)

我正在尝试开发我的第一个R闪亮应用程序。我正在尝试创建一个CheckboxGroupInput()。在我的数据集中,有两种不同类型的飞机。因此,用户可以决定是查看两种机型的折线图,还是只查看其中一种机型的折线图 我运行的错误是: Warning: Error in : Problem with `filter()` input `..1`. x Input `..1` must be ..
发布时间:2022-08-30 15:53:47 其他开发

在R(StringR)中使用正则表达式提取用于购物篮分析的产品项目时出错

Order_id PRODUCT_NAME 1 普通-高附着力有机硅底漆-30ml,普通-天然保湿因子+HA 30ml 2 Sandal,Brown-44 3 醋酸盐正方形黑色过渡太阳镜,卡地亚-8221-边少绿色双色太阳镜,雷朋-飞行员-棕色双色-3026-钻石硬质坚硬镜片,Burberry-2A357-哈瓦那-飞行员-太阳镜,醋酸盐正方形-黑色-过渡性太阳镜,卡地亚-8221-边少绿色双 ..
发布时间:2022-08-18 15:51:10 其他开发

覆盖Left_Join dplyr以更新数据

我的问题类似于这个问题,但我在LHS中有额外的列应该保留https://stackoverflow.com/a/35642948/9285732 y是x的子集,val1的值已更新。在x中,我希望覆盖相关值,但保留其余值。 样本数据: library(tidyverse) x ..
发布时间:2022-08-14 11:42:43 其他开发

使用dplyr和tidyr计算分组数据的平均值。

我只是在学习R,并试图找到修改我的分组data.frame的方法,以便获得内聚观测的变量value(x+y/2)的平均值和标准差(sd)SQRT((x^2+y^2)/2)。其他(相等)变量(sequence、value1)不应更改。 我使用了subset()和rowMeans(),但我想知道是否有更好的方法使用dplyr和tidyr(可能使用嵌套数据帧?) 我的测试数据。框架如下: ..
发布时间:2022-08-14 11:26:17 其他开发

一列的组合之间的公共列

我有来自分析的数据集。为了解释结果,我正在尝试构建数据帧 结果应如下: 基因名称|Motif_id_1|Motif_id_2|发生|匹配序列 此处某些Motif_id可能共享gene_name,且结果应该是Motif_id的两个组合(允许重叠)。 我尝试了以下代码,但结果未给出Motif_id内的组合。 merge_practice ..
发布时间:2022-08-13 18:08:56 其他开发

在GROUP_BY()之后获取count()以查找非缺失值

我有一些缺少值的数据(即NA值),简化格式如下(最后输入的代码): #> id x country #> 1 1 2.0 USA #> 2 2 4.0 USA #> 3 3 3.5 JPN #> 4 4 NA JPN 对于每个国家,我想取x的平均值和x的可用值的计数(即不是NA),所以我使用了group_by,它适用于mean: ..
发布时间:2022-08-03 21:03:02 其他开发