summarize相关内容
我正在尝试找到一种方法,使用dplyr 一步获得汇总统计数据,例如按组和总体的平均值 #Data set-up sex
..
我要查找每个组的列的最小值和最大值: mtcars %>% group_by(mtcars$cyl) %>% summarize( min_mpg = min(mtcars$mpg), max_mpg = max(mtcars$mpg) ) # # A tibble: 3 x 3 # `mtcars$cyl` min_mpg max_mpg #
..
在更新到 dplyr 开发版本 0.8.99.9003 后运行 group_by 和 summarise() 时,我开始收到一条新消息(见帖子标题). 这是重新创建输出的示例: 图书馆(tidyverse)图书馆(哈布拉尔)df
..
使用 python 我创建了以下包含相似值的数据框: cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard1 0.770 0.489 0.388 0.57500000 0.5845137 0.3920000 0.000000002 0.067 0.496 0.912 0.13865546 0.
..
index type.x type.y col3 col41 上午 20 252 米 30 28凌晨 3 点 15 5553 和 20 555凌晨 4 点 666 104 米 666 20 当我尝试获得这种形状时,我尝试聚合保持索引和 group_by 没有成功: index col3 col41 20 252 30 283 35 5554 666 30 解决方案 如果您使用的是 base
..
我有一个这样的数据框 观测值:2,190,835变数:13$ Patientid4489、4489、4489、4489、4489、4489、4489、4489、4489、4489、4489、4489、4489、4489、4489、4489、4489…$ prepareid1000307、1000307、1000307、1000307、1000307、1000307、100
..
假设我有以下(简化的)小标题,其中包含一组和向量中的值: set.seed(1)(tb_vec1 A2 A3 B4 B5
..
假设我有一个类似的数据框 term cnt苹果10苹果53个苹果蓝梨3梨1 如何过滤此列中的所有部分找到的字符串,例如结果 term cnt苹果10梨1 并未指示我要过滤(匹配)的术语,而是通过自我引用的方式(即,它确实对照整个列检查了每个术语,并删除了部分匹配的术语).令牌的数量不受限制,字符串的一致性也不受限制(即"mapples"将与"apple"匹配).这将导致基于dply
..
我目前正在尝试应用摘要功能,以便将相关观察结果与大数据集隔离开.此处提供了一个简单的可重现示例: df
..
我正在尝试通过装箱表示一些连续的数据.区域的连续加权数据应归类为:VeryHigh,High,Low,VeryLow.权重值基于按区域分组的某些事件类型之间的相互作用,因此可以根据报表用户选择的类型进行更改. 我在下面提供了一些示例数据,并概述了到目前为止所做的事情. 从五组区域数据(A-E)开始.在每个事件中都有一个或多个事件类型.每个事件都有一个权重及其在区域内发生的次数(计数).
..
我正在尝试在大型数据框中按行计算二进制字符的结果: V1 V2 V3 V4 V5损失损失损失损失损失损失损失双赢损失损失损失损失损失 我需要知道的是按行输赢的频率.这只是一个简短的示例(大型模拟输出的片段),但对于第1行,在5个模拟中,我有5个亏损,第2行有3个亏损,有2个获胜,依此类推. 我希望生成一个单独的表格,按行显示获胜/失败的频率,或者,如果这行不通,请添加两列新列:其中一
..
在我的论文中,我估计了不同的“内”。和“汇集”使用plm软件包的plm()建立模型。另外,我通过使用时滞修改了一些模型。所有模型都运行良好,我得到了结果。现在,我想通过显示模型方程来可视化模型。所以我的问题是: 有没有一种方法可以从模型中提取方程式? 在之前,我会以最基本的方式使用它任何计算都可以完成。... 或多或少像这样,因为 对于我的模型,我使用面板数据集,而我的模型看起
..
我有一个如下数据框: 日期耀斑Painmed_Use 1 2015-12-01 0 0 2 2015-12-02 0 0 3 2015-12-03 0 0 4 2015-12-04 0 0 5 2015-12-05 0 0 6 2015-12-06 0 1 7 2015-12-07 1 4 8 2015-12-08 1 3 9 2015-12-09 1 1
..
我正在尝试创建一个表格,该表格显示 N (观察次数),频率百分比(答案> 0)以及百分比频率的上下置信区间,我想按类型分组。 数据示例 dat
..
很抱歉,标题很糟糕,但是很难解释。我有以下数据和要汇总的函数: library(tidyverse) #生成数据 df% as_tibble()%&%;% mutate(group = sample(c('a','b'),100,rep
..
我有一个数据集,其中包含按网点每周销售的各种产品。数据如下所示: 商店ID星期ID商品代码$ 253422 191 41130 2.95 272568 188 41130 2.95 272568 188 41160 2.95 272568 189 41130 2.95 272568 189 41160 2.95 272568 190 41160 2.95 2174
..
问候和问候!这是我关于堆栈溢出的第一篇文章。我对R甚至是较新的dplyr都是新手。我有一个由2列组成的小型数据集-var1和var2。 var1列由num个值组成。 var2列包含3个级别的因子-A,B和C。 var1 var2 1 1.4395244 A 2 1.7698225 A 3 3.5587083 A 4 2.0705084 A 5 2.1292877 A
..
我希望用自定义汇总功能汇总小标题中的每一列,该汇总函数将根据数据返回不同大小的小标题。 假设我的汇总函数是 mysummary%as_tibble} 它可以这样应用于一列: cars%>%summarise(speed.summary = list(mysummary
..
我正在对数据进行分组,然后对其进行汇总,但也想保留另一列。我不需要对该列的内容进行任何评估,因为它将始终与group_by列相同。我可以将其添加到group_by语句中,但这似乎并不“正确”。我想按 State 分组后保留 State.Full.Name 。谢谢 TDAAtest
..
我有一个函数,用于计算根据变量 VarName 的内容选择的列的分组数据库的平均值。当前函数使用 dplyr :: summarize _ ,但是现在我不赞成使用此函数,并且我想在完全删除它之前对其进行替换。 但是,我不确定如何使用新的取消引号来实现我要执行的操作。这是我当前的代码: means
..