dplyr相关内容
我想稍微简化一下代码,并尝试使用自定义构建函数。我构建了以下虚拟对象: library(dplyr, tidyverse) ## string
..
我有一个DF As Under +-----+------+--------+--------------------+------+---------+ | ID1 | ID2 | DOC_NO | DATE | COST | CLIENT | +-----+------+--------+--------------------+------+------
..
我正在尝试扩展我的一些ML管道,我喜欢Spaklyr打开的RStudio、Spark和H2O的组合(http://spark.rstudio.com/) 我想弄明白的一件事是如何使用Spaklyr从数据帧中的字符向量创建伪COL。 我已经尝试了下面的方法,但我认为它可能混合了一些Spaklyr尚未实现的功能。 library(sparklyr) library(dplyr) s
..
我很难使用data.table来总结向量函数的结果,这在ddply中很容易做到。 问题1:使用具有向量输出的(开销很大的)函数进行聚合 dt
..
我正在处理的数据集如下 Id Date Color 10 2008-11-17 Red 10 2008-11-17 Red 10 2008-11-17 Blue 10 2010-01-26 Red 10 2010-01-2
..
我正试图从名为CoinMarkets&的网站上获取加密货币的历史价格,但我做不到。我知道有很多关于这个话题的帖子,我几乎尝试了所有的帖子,但所有的方法对我都不起作用。我使用的是Windows10,我尝试了检查方法。我哪里做错了?我的代码是: dataurl = "https://coinmarketcap.com/currencies/bitcoin/historical-data/" d
..
我正在尝试计算组之间的变化百分比,其中有一个对照和几个处理,在我的数据框中被组织为组。因为我有很多观察,所以我使用dplyr。我不明白的是,如何有效地设定与哪一组进行比较?通常,我会将此任务分成多个步骤: 分组计算平均值 子集控制组以创建新的“控件”数据帧 将“控制”数据帧联接到第一个DF 计算对照和处理之间的变化百分比。 不过,我想知道dplyr是否已经有了一个更简单、更直截了
..
我正在尝试开发我的第一个R闪亮应用程序。我正在尝试创建一个CheckboxGroupInput()。在我的数据集中,有两种不同类型的飞机。因此,用户可以决定是查看两种机型的折线图,还是只查看其中一种机型的折线图 我运行的错误是: Warning: Error in : Problem with `filter()` input `..1`. x Input `..1` must be
..
Order_id PRODUCT_NAME 1 普通-高附着力有机硅底漆-30ml,普通-天然保湿因子+HA 30ml 2 Sandal,Brown-44 3 醋酸盐正方形黑色过渡太阳镜,卡地亚-8221-边少绿色双色太阳镜,雷朋-飞行员-棕色双色-3026-钻石硬质坚硬镜片,Burberry-2A357-哈瓦那-飞行员-太阳镜,醋酸盐正方形-黑色-过渡性太阳镜,卡地亚-8221-边少绿色双
..
假设我有两个文件,file1.txt和file2.txt,如下所示: file1.txt blablabla lorem ipsum year: 2007 Jan Feb Mar 1 2 3 4 5 6 file2.txt blablabla lorem ipsum year: 2008 Jan Feb Mar 7 8 9 10 11 12
..
更新:显然,此功能现在计划用于dplyr,如下所述:https://github.com/tidyverse/dplyr/pull/6145 在SQL中,当给定的情况得到验证时,可以为多个变量赋值--比如var1和var2,其结构类似 Case When Condition Then var1=x,var2=y dplyr::Case_When(或tidyVerse中的任何其他内
..
我的问题类似于这个问题,但我在LHS中有额外的列应该保留https://stackoverflow.com/a/35642948/9285732 y是x的子集,val1的值已更新。在x中,我希望覆盖相关值,但保留其余值。 样本数据: library(tidyverse) x
..
在深入了解tidyVerse之后,我开始一次拟合许多线性模型,如this中所述。也就是说,我会按照以下思路做一些事情: library(dplyr) library(tidyr) library(purrr) df
..
我只是在学习R,并试图找到修改我的分组data.frame的方法,以便获得内聚观测的变量value(x+y/2)的平均值和标准差(sd)SQRT((x^2+y^2)/2)。其他(相等)变量(sequence、value1)不应更改。 我使用了subset()和rowMeans(),但我想知道是否有更好的方法使用dplyr和tidyr(可能使用嵌套数据帧?) 我的测试数据。框架如下:
..
我有来自分析的数据集。为了解释结果,我正在尝试构建数据帧 结果应如下: 基因名称|Motif_id_1|Motif_id_2|发生|匹配序列 此处某些Motif_id可能共享gene_name,且结果应该是Motif_id的两个组合(允许重叠)。 我尝试了以下代码,但结果未给出Motif_id内的组合。 merge_practice
..
我有一个由3个COLS组成的数据帧: tweet_id | response_id | time 1 2 22:10:47 2 NA 22:10:13 3 1 22:08:27 4 3 21:54:49 5
..
我有一些缺少值的数据(即NA值),简化格式如下(最后输入的代码): #> id x country #> 1 1 2.0 USA #> 2 2 4.0 USA #> 3 3 3.5 JPN #> 4 4 NA JPN 对于每个国家,我想取x的平均值和x的可用值的计数(即不是NA),所以我使用了group_by,它适用于mean:
..
在变量块上使用pivot_longer时遇到问题。假设我有这个: 我想要这个: dfwide
..
我有此数据帧: df
..
我正在学习Hadley Wickham的R for Data Sciencehttps://r4ds.had.co.nz/many-models.html的第25章“多种模型”,但在重新创建25.2.2中的示例时遇到了问题。 以下是我到目前为止所拥有的(以及正在运行的): require(gapminder); require(tidyverse); require(broom); r
..