aggregate相关内容

Scala-Spark用参数值动态调用groupby和agg

我想编写一个自定义分组和聚合函数来获取用户指定的列名和用户指定的聚合图。我不知道列名和聚合映射图。我想写一个类似于下面的东西的函数。但我是新来的Scala,我无法解决它。 def groupAndAggregate(df:DataFrame,aggregateFun:Map [String,String ],cols:List [String]):DataFrame = { val gr ..
发布时间:2018-05-30 13:47:50 其他开发

T-SQL GROUP BY:包含其他分组列的最佳方法

我正在加入一些表格,并将一些表格集合在一起通过GROUP BY列。 一个简单的例子是员工和项目: 从雇员中选择empID,fname,lname,title,dept,count(projectID) E在E.empID = P.projLeader 中加入项目P ...可以在MySQL中使用,但MS SQL更严格,要求所有内容都包含在聚合函数中或是GROUP ..
发布时间:2018-05-30 13:43:55 数据库

按年份和月份计算总计

id,created,action 1,'2011- 01-01 04:28:21','注册' 2,'2011-01-05 04:28:21','注册' 3',2011-02-02 04:28 :21','注册' 如何选择和分组这些输出如下: 年,月,总 2011,1,2 2011,2,1 解决方案 试试这个: SELECT DATE ..
发布时间:2018-05-30 13:43:50 数据库

熊猫:在一组中使用多个函数

我的数据有年龄限制,还有每月付款。 我正在汇总汇总汇总,但没有总结年龄(平均会起作用)。 对不同的列可以使用不同的函数吗? 解决方案 您可以将字典传递给 agg ,列名作为键和函数你需要作为值。 将pandas作为pd 导入numpy作为np #创建一些随机数据 N = 20 date_range = pd.date_range('01 / 01/2015' ..
发布时间:2018-05-30 13:42:16 Python

按时间分组记录

我有一个包含日期时间列和其他一些其他列的表。日期时间列表示正在发生的事件。它可以包含一个时间(当时发生的事件)或NULL(事件没有发生) 我现在要计算在特定时间间隔内发生的记录数(15分钟),但不知道该怎么做。 例子: id |时间| foreign_key 1 | 2012-01-01 00:00:01 | 2 2 | 2012-01-01 00:02:01 | 4 ..
发布时间:2018-05-30 13:42:02 数据库

我可以使用group by的非聚合列吗?

您不能(不应该)将非集合放在 GROUP BY 查询的 SELECT 行中。 然而,我想要访问与最大值关联的非聚合之一。用简单的英语,我想要一个具有每种最古老的ID的表。 CREATE TABLE stuff( id int , kind int, 年龄int ); 这个查询给了我后面的信息: SELECT kind,MAX(age) FROM s ..
发布时间:2018-05-30 13:38:11 数据库

没有聚合函数的GROUP BY子句的任何原因?

我现在(彻底)在学习SQL,并遇到了 GROUP BY 子句。 GROUP BY 根据您提供的参数对结果集进行聚合或分组。如果在查询中使用此子句,则可以对结果集执行集合函数以查找有关结果集的统计信息,如查找平均值(AVG())或频率。 我的问题是:GROUP BY语句在没有附加聚合函数的情况下是否有用? 更新 使用 GROUP BY 作为 DISTINCT 是(可能)不好的主意 ..
发布时间:2018-05-30 13:36:46 数据库

为什么我需要显式指定SQL中的所有列“GROUP BY”子句 - 为什么不是“GROUP BY *”?

这一直困扰着我 - 为什么SQL语句中的GROUP BY子句要求包含所有非聚合列?这些列应该默认包含 - 一种“GROUP BY *” - 因为我甚至无法运行查询,除非它们全部包含在内。每一列都必须是一个聚合或在“GROUP BY”中指定,但似乎任何未聚合的东西都应该自动分组。 也许它是ANSI-SQL标准,但即便如此,我也不明白为什么。有人可以帮我理解这个约定的必要吗? 解决方案 ..
发布时间:2018-05-30 13:36:43 其他开发

熊猫集团和总和

水果日期名称编号 Apples 10/6/2016 Bob 7 苹果10/6/2016鲍勃8 苹果10/6/2016麦克9 苹果10/7/2016史蒂夫10 苹果10/7/2016鲍勃1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 ..
发布时间:2018-05-30 13:31:23 Python

按多列分组

如何在LINQ中实现GroupBy多列 类似于SQL中的这个: SELECT * FROM GROUP BY, 如何将其转换为LINQ: QuantityBreakdown ( ProductID int, ProductID int, 数量float ) INSERT INTO ..
发布时间:2018-05-30 13:31:06 C#/.NET

R堆积条形图与汇总数据

我遇到了用集合数据创建堆叠条形图的麻烦。在处理来自其他人的报告的聚合表时,我通常使用Excel,但是我想开始在R中完成所有的图表,可能使用格或ggplot。在Excel中,对下列汇总数据进行堆叠的条形图需要几次点击(插入,柱形图,堆积列),并且您得到了类似这样的内容。。 除了想在R中使用这个图表,我还希望使用ggplot的faceting,在ggplot中并排放置两个堆叠的barcharts ..
发布时间:2018-04-24 20:36:41 其他开发

Qlikview恶化与条件

我有一些数据如下所示 - id,fn,ln,logdate 1,Rob,Hep ,01-04-2010 2,Rob,Hep,09-04-2010 3,Rob,Hep,10-10-2012 4,Rob,Hep,01-12- 2009 5,Peter,Cheng,02-10-2010 6,bob,Pen,05-10-2009 7,Peter,Cheng,01-10- ..
发布时间:2017-10-07 16:55:39 其他开发

实体框架与LINQ聚合连接字符串?

这对我来说很容易在TSQL中执行,但我只是坐在这里,把我的头撞到桌面,试图让它在EF4中工作! 我有一张桌子,让它叫做TestData。它有字段,例如:DataTypeID,Name,DataValue。 DataTypeID,Name,DataValue 1,“Data 1 “,”Value1“ 1,”Data 1“,”Value2“ 2,”Data 1“,”Value3“ ..
发布时间:2017-08-21 23:17:47 C#/.NET

如何在Entity Framework Query中连接字符串?

如何连接Entity Framework中的字符串4我有一个列的数据,我想以字符串形式保存一个逗号分隔的字符串,如“value1,value2,value3” 是否有方法或操作符在EF4中做这个吗? 示例:让我们说,我有两列 Fruit 和 Farms 具有以下值: 苹果 香蕉 草莓 如果我这样做 var dataSource = this.context .Fa ..

基于唯一键的术语聚合

我有一个包含文件的索引。它们中的每一个都具有每个用户具有不同值的密钥“userid”,但是每个用户可以具有多个文档。每个用户都有其他属性(如“颜色”,“动物”)。 我需要获取每个属性的密码数量: aggs:{ colors:{terms:{field:color}}, animals:{terms:{field:animal但是我需要每个唯一用户标识的这些数据,也许是: > ..
发布时间:2017-08-07 03:51:13 分布式计算/Hadoop