summarization相关内容

如何计算 R 中 data.table 中的出现组合

我有两个 data.tables.我想计算与另一个表中的表组合匹配的行数.我检查了 data.table 文档,但没有找到答案.我正在使用 data.table 1.9.2. DT1 现在我想计算 DT2 中 (3, 8) 对和 (2, 3) 对的数量. setkey(DT2, w, x)nrow(DT2[J(3, 8), nomatch=0])# [1] 3 ## 好!nrow(DT2[ ..
发布时间:2022-01-13 19:23:58 其他开发

汇总所有列

我有以下格式的数据: gen = function () sample.int(10, replace = TRUE)x = data.frame(A = gen(), C = gen(), G = gen(), T = gen()) 我现在想将行中所有元素的总和附加到每一行(我的实际函数更复杂,但 sum 说明了问题). 没有 dplyr,我会写 cbind(x, Sum = app ..
发布时间:2021-12-23 12:52:36 其他开发

Elasticsearch:可以处理聚合结果吗?

我使用 SUM-Aggregation 计算我的服务流程的持续时间.执行过程的每一步都将保存在 Elasticsearch 中的调用 Id 下. 这是我监控的: ID #123 的请求处理持续时间(调用服务 #1)ID #123 的服务器响应持续时间(调用服务 #1)**完成 ID #123 的持续时间**ID #124 的请求处理持续时间(调用服务 #1)ID #124 的服务器响应持续 ..
发布时间:2021-12-13 12:24:25 其他开发

R语言中的文本摘要

我有使用 R 语言 帮助的长文本文件 我想用至少 10 到 20 行或小句子总结文本.如何用R语言总结至少10行文字? 解决方案 你可以试试这个(来自 LSAfun 包): genericSummary(D,k=1) 其中“D"指定您的文本文档,“k"指定要在摘要中使用的句子数.(进一步的修改显示在包文档中). 欲了解更多信息:http://search.r-project.or ..
发布时间:2021-09-06 19:05:02 其他开发

如何创建一个列来标识汇总数据框中仅包含新数据的行?

我有一个基于先前研究建立的数据集,但其中包含许多全新的条目.清理后,数据集由研究中包括的每个物种的平均值组成,这些平均值是我使用 tidyverse 中的 summarise 函数创建的. df 我知道如何使用“&"替换基于和/或语句的列.和"|"对于另一列中的某些级别,但是如果用于创建汇总值的各个条目均不具有特定级别或字符串,则我不确定如何创建new = TRUE的列.我认为使用 ifel ..
发布时间:2021-05-02 20:54:36 其他开发

带有汇总r的逻辑值计数

在数据框中,我有一列具有Y和N值.该数据框还具有一个id列.我想创建两列,一列的每个ID的总Y计数,另一列的总N数.我尝试使用dplyr汇总功能执行此过程 group_by(id) %>% summarise(total_not = count(column_y_e_n == "N"), total_yes = count(column_y_e_n == "Y") ..
发布时间:2020-11-21 00:58:48 其他开发

在SQL Server 2008中分解汇总表

我已经从外部来源接收到了汇总格式的数据.我需要一种将其分解为适合我正在使用的系统的方法. 为说明起见,假设我收到的数据如下所示: receivedTable: Age Gender Count 40 M 3 41 M 2 我希望这是一种分解的格式,如下所示: systemTable: ID ..
发布时间:2020-07-10 03:39:45 其他开发

通过php中的给定间隔对测量/时间序列求和的有效方法

我在15分钟的同一时间间隔内有一系列测量数据/时间序列.此外,我有一个给定的时间段(例如,一天,当前星期,月份,年份(...),并且需要按小时,天,月份,(...)汇总值. 例如按天汇总上个月的所有值. 我的方法是在第一步中生成一个具有每个周期所需间隔的临时数组.例如.在PHP中(PHP并不是必需的,如果它提供了更快的方法,我会更喜欢Python或Javascript) $thi ..
发布时间:2020-07-10 03:39:34 PHP

ROUGE评估方法给出零值

我已按照 http://kavita-ganesan.com/rouge-howto中的说明设置了所有参数.但是我得到的精度召回和f-1的值为零.请帮我该怎么办? 解决方案 如果正确设置了所有参数,并且在运行rouge时没有出现任何错误,则可能在将摘要文件制成html格式时发生了以下错误. rouge does not handle whitespaces properly thu ..
发布时间:2020-07-10 03:39:30 其他开发

汇总多组列

我遇到的情况是我的数据框包含图像分析结果,其中列是图像中特定类的比例,因此示例数据框class_df看起来像: id A B C D E F 1 0.20 0.30 0.10 0.15 0.25 0.00 2 0.05 0.10 0.05 0.30 0.10 0.40 3 0.10 0.10 0.10 0.20 0.20 0.30 这些类中的每 ..
发布时间:2020-07-10 03:39:23 其他开发

MySQL ON DUPLICATE KEY UPDATE在唯一键中具有可空列

我们的MySQL Web分析数据库包含一个摘要表,该表在导入新活动时全天进行更新.我们使用ON DUPLICATE KEY UPDATE来使摘要覆盖早期的计算,但是由于摘要表的UNIQUE KEY中的列之一是可选的FK,并且包含NULL值,因此存在困难. 这些NULL旨在表示“不存在,并且所有此类情况都是等效的".当然,MySQL通常将NULL视为“未知,并且所有这种情况都不相同". ..
发布时间:2020-07-10 03:39:16 数据库

如何为R中的多个列计算组内的百分比变化?

我有一个带有ID列,日期列(每个ID为12个月)的数据框,并且有23个数字变量.我想获取每个ID中每个月的百分比变化.我正在使用quantmod软件包以获得百分比变化. 这里是一个只有三列的示例(为简单起见): ID Date V1 V2 V3 1 Jan 2 3 5 1 Feb 3 4 6 1 Mar 7 8 9 2 Jan 1 1 1 2 ..
发布时间:2020-07-10 03:39:14 其他开发