aggregation 第8页 - IT屋-程序员软件开发技术分享社区

Spark中的累积产品？

我尝试在Spark Scala中实现累积产品，但我真的不知道如何做到。我有以下数据框：输入数据： +-+-+ ------ -+ ---- + | A | B |日期| val | +-+-+ -------- + ---- + | rr | gg | 20171103 | 2 | | hh | jj | 20171103 | 3 | | rr | gg | 2017 ..

发布时间：2020-06-02 20:51:59 scala apache-spark apache-spark-sql aggregation 其他开发

如何在R中使用聚合函数

请问我如何在R中正确使用聚合函数？我有这样的数据：运动流程 [1，]“ Other”“ 1” [2，]“其他”“ 1” [3，]“其他”“ 1” [4，]“其他”“ 1” [5，] “ Other2”“ 1” [6，]“ Other2”“ 1” 我需要得到这个：运动流程 [1，]“ Other”“ 4” [2，]“ Other2” ..

发布时间：2020-06-02 20:51:57 r aggregation 其他开发

在构造函数中调用类成员的构造函数

我可以在类的构造函数中调用成员的构造函数吗？让我说如果我有成员 bar MClass 中，类类型为 foo 的>。我可以在MClass的构造函数中调用bar的构造函数吗？如果不是，那我该如何初始化我的会员栏？这是在组合（聚合）中初始化会员的问题。解决方案是的，当然可以！这就是构造函数初始化器列表的用途。这是一项基本功能，您需要初始化没有默认构造函数的成员以及常量和引用： ..

发布时间：2020-06-02 20:51:53 c++ constructor aggregation C/C++开发

在子查询中汇总按位或

给出下表：创建表BitValues（n int）是否有可能为内的所有行计算 n 的按位或子查询？例如，如果BitValues包含以下4行： + --- + | n | + --- + | 1 | | 2 | | 4 | | 3 | + --- + 我希望子查询返回7。有没有一种方法可以内联，不创建UDF ？解 ..

发布时间：2020-06-02 20:51:49 sql-server sql-server-2005 tsql aggregation 数据库

表中数值连续出现的次数

我在表下面创建表#t（Id int，名称字符）插入#t值（1，'A'），（2，'A'），（3，'B'），（4，'B '），（5，'B'），（6，'B'），（7，'C'），（8，'B'），（9，'B'）我想计算名称列中的连续值 + ------ + ------------ + |姓名|重复 + ------ + --------- ..

发布时间：2020-06-02 20:51:47 sql-server tsql sql-server-2012 aggregation 数据库

为什么Spark Parquet文件的合计大于原始文件？

我正在尝试创建一个供最终用户使用的聚合文件，以免他们处理具有更大文件的多个源。为此，我： A）遍历所有源文件夹，剥离最常请求的12个字段，将实木复合地板文件拆分到这些结果并置的新位置。 B）我尝试浏览步骤A中创建的文件，并通过按12个字段分组将它们重新汇总，以将其减少为每个唯一组合的摘要行。我发现，步骤A减少了5：1的有效负载（大约250演出变成48.5演出）。但是，步骤B而不是进一步 ..

发布时间：2020-06-02 20:51:45 apache-spark storage aggregation parquet 其他开发

按列“ grp”分组并压缩DataFrame-（按列“ ord”排序的每个列的最后一个非空值）

假设我具有以下数据框： + --- + -------- +- -+ ---- + ---- + | grp | null_col | ord | col1 | col2 | + --- + -------- + --- + ---- + ---- + | 1 | null | 3 | null | 11 | | 2 | null | 2 | xxx | 22 | | ..

发布时间：2020-06-02 20:46:08 scala apache-spark aggregate-functions aggregation 其他开发

如何在SQL Server 2005中一天平均/求和数据

我正在尝试对SQL Server 2005中的数据进行平均计算。如果我将简单查询用作 SELECT时间戳记，则从ROASTER_FEED $ b中馈入，这就是我的数据库的外观$ b订购时间戳记数据： timestamp Feed 2011年2月7日12:00:01 1246 2011年2月7日12:00:01 1234 2011年2月7日12:00 ..

发布时间：2020-06-02 20:44:04 sql-server-2005 aggregate-functions aggregation 其他开发

SQL Server中的自定义聚合函数（concat）

问题：我想编写一个自定义聚合函数，将group by上的字符串连接起来。这样我就可以做选择SUM（FIELD1）为f1，MYCONCAT（FIELD2）为f2 来自TABLE_XY GROUP BY FIELD1，FIELD2 我发现的只是SQL CRL聚合函数，但是我需要没有CLR的SQL。编辑：1 查询应如下所示： ..

发布时间：2020-06-02 20:43:36 sql sql-server-2005 sql-server-2008 aggregate-functions aggregation 其他开发

时间范围内的汇总

我有一个数据集，其中包含日期{yyyy / mm / dd}和时间{h，m，s}和温度{float}作为单独的列。我想通过平均功能汇总每天的温度值。问题是，我不知道如何查询时间属性以说例如总计 {h，m，（0-5）s} 和 {h，m，（5-10）s} 和 {h，m，（10-15）s} 和...，自动。解决方案选择天， to_char（date_trunc（'minu ..

发布时间：2020-05-30 00:47:23 postgresql time aggregation 其他开发

在SQL中通过日期和时间执行聚合

我有一个数据集，其中包含以2分钟为频率的几周观察结果。我想将时间间隔从2分钟增加到5分钟。问题在于，观察的频率并不总是相同的。我的意思是，从理论上讲，每10分钟应进行5次观察，但通常情况并非如此。请让我知道如何根据平均函数以及观察时间和日期来汇总观察。换句话说，基于每5分钟的汇总，而每5分钟的时间间隔的观察次数不同。而且，我有时间戳格式的日期和时间。示例数据： 1 ..

发布时间：2020-05-29 22:41:29 sql postgresql timestamp aggregation 其他开发

将每N个值分组

我在PostgreSQL中有一个这样的表。我想基于ID（这是主键）对每16条记录执行诸如均值和最大值的聚合函数。例如，我必须计算前16个记录和后16个记录的平均值，依此类推。 + ----- + ------------- | ID |降雨| + ----- + ----------- | | 1 | 110.2 | | 2 | 56.6 | | 3 | 65.6 | ..

发布时间：2020-05-29 22:27:18 postgresql group-by aggregation 其他开发

如何在没有UNION，ROLLUP或CUBE的情况下使用PIVOT表计算总行数?

有人可以帮忙计算一下此PIVOT表底部的总行吗? select *, [Drug1] + [Drug2] + [Drug3] + [Drug4] + [Drug5] as [Total] from (Select [id], [drug], [Diagnosis] from DrugDiagnosis ) as ptp ..

发布时间：2020-05-28 01:23:02 sql-server pivot aggregation cube rollup 数据库

SQL Server PIVOT-多个聚合

给出以下结果集: --------------------------------------------------------- CustomerID Service TransType SubTotal Tax NetTotal --------------------------------------------------------- 106 ..

发布时间：2020-05-28 01:00:52 sql-server tsql pivot aggregation 数据库

熊猫:过去n天的平均值

我有一个Pandas数据框，如下所示: test = pd.DataFrame({ 'Date' : ['2016-04-01','2016-04-01','2016-04-02', '2016-04-02','2016-04-03','2016-04-04', '2016-0 ..

发布时间：2020-05-23 23:59:04 python pandas time-series aggregation Python

熊猫-是否可以使用两种不同的聚合方式聚合两列?

我正在加载一个csv文件，该文件包含以下列: 日期，textA，textB，numberA，numberB 我想按以下列进行分组:日期，textA和textB-但要对numberA应用"sum"，但对numberB应用"min". data = pd.read_table("file.csv", sep=",", thousands=',') grouped = data.groupb ..

发布时间：2020-05-23 22:54:41 pandas aggregation Python

在Pandas中转换与聚合

在对Pandas DataFrame进行分组时，什么时候应该使用transform，什么时候应该使用aggregate?怎么做它们在实际应用方面有所不同，您选择哪一个认为更重要? 解决方案考虑数据框df df = pd.DataFrame(dict(A=list('aabb'), B=[1, 2, 3, 4], C=[0, 9, 0, 9])) groupby是标准用途聚合 ..

发布时间：2020-05-23 21:57:26 python pandas pandas-groupby aggregation Python

大熊猫聚集

如何与熊猫进行聚合? 聚合后没有DataFrame！发生什么事了? 如何主要汇总字符串列(到list s，tuple s，strings with separator)? 如何汇总计数? 如何创建由汇总值填充的新列? 我已经看到这些重复出现的问题，询问熊猫聚合功能的各个方面. 如今，有关汇总及其各种用例的大多数信息都分散在数十个措辞不佳，无法搜索的帖子中. 这里的目的是整理一些关于后 ..

发布时间：2020-05-23 21:12:57 python pandas dataframe pandas-groupby aggregation Python

通过R中的组连接列

假设我有此员工列表: Dept Date Name ----- --------- --------------- 30 07-DEC-02 Raphaely 30 18-MAY-03 Khoo 40 07-JUN-02 Mavris 50 01-MAY-03 Kaufl ..

发布时间：2020-05-21 23:56:58 string r oracle text aggregation 数据库

是否有一个Oracle SQL查询将多行汇总为一行?

我有一个看起来像这样的表: A 1 A 2 B 1 B 2 我想生成一个如下所示的结果集: A 1 2 B 1 2 是否存在将执行此操作的SQL语句?我正在使用Oracle. 相关问题: 从一行返回多行我的问题与这个问题的相反. 使用LINQ进行连接这正是我要执行的操作，但是没有LINQ. 解决方案这取决于您使用的Oracle版本.如果它支持wm ..

发布时间：2020-05-21 22:25:48 sql oracle aggregation string-concatenation 数据库

aggregation相关内容