group-by相关内容

不同的值对 SQL

考虑 创建表对(编号 a,编号 b) 数据在哪里 1,11,11,12,42,43,23,25,1 等等. 什么查询给了我数字列 b 的不同值所以我可以看到 1,15,12,43,2 只有 我试过了 select distinct ( a ) , b from pair group by b 但给了我“不是按表达分组" 解决方案 你的意思是要么 SELECT ..
发布时间:2021-12-27 08:12:51 其他开发

在 Pandas 中过滤分组的 DataFrame

我正在从 Pandas DataFrame 创建一个 groupby 对象,并且想要选择带有 > 的所有组.1 个尺寸. 示例: A B0 富 01 条 12 富 23 富 3 以下似乎不起作用: grouped = df.groupby('A')分组[分组.大小>1] 预期结果: A023 解决方案 从 pandas 0.12 开始,您可以: >>>grouped.fil ..
发布时间:2021-12-27 08:12:47 Python

GROUP BY 但从其他列中获取所有值

我将举例说明我需要做什么.首先,我们有一个像这样的简单表,名为table: id |名称====+======1 |富1 |酒吧1 |食物吧2 |富2 |酒吧2 |食物吧 现在查询: SELECT t.* FROM table t GROUP BY t.id 会得到与此类似的结果: id |名称====+======1 |富2 |富 但是是否有可能收集 name 的所有值以获得这样的结 ..
发布时间:2021-12-27 08:12:40 其他开发

Python pandas:向我的数据框中添加一列计算变量的列

我有一个像这样的数据框“gt": 组织组组织 1 1组织2 1组织3 2组织4 3组织5 3组织6 3 我想将列“计数"添加到 gt 数据框以计算组的成员数量,预期结果如下: 组织组计数组织 1 1 2组织 2 1 2组织 3 2 1组织 4 3 3组织5 3 3组织 6 3 3 我知道如何对组中的每一项进行计数,但不知道如何使所有组项的计数重复,这是我使用的代码: gtcounts = ..
发布时间:2021-12-27 08:12:33 Python

更改编号列

我有 NAME 和 PAY,但在这个例子中我需要 CHANGEGROUP: 名称支付日期更改组莎莉 12 10/01/2011 1莎莉 12 10/01/2011 1莎莉 12 11/02/2011 1莎莉 12 11/02/2011 1莎莉 12 12/01/2012 1莎莉 13 04/23/2013 2莎莉 12 04/24/2013 3莎莉 10 05/01/2013 4莎莉 10 10 ..
发布时间:2021-12-27 08:12:08 数据库

按顺序计算每组熊猫

我有一个按两列分组的 df.我想按顺序计算每个组.下面的代码按顺序计算组中的每一行.这似乎比我想象的要容易,但无法弄清楚. df = pd.DataFrame({'键':['10003', '10009', '10009', '10009','10009', '10034', '10034', '10034'],“日期 1":[20120506、20120506、20120506、2012050 ..
发布时间:2021-12-27 08:11:51 Python

分组并计算Javascript数组中属性的平均值/平均值

我很难在其他 stackoverflow 帖子中找到我正在寻找的解决方案,尽管我强烈觉得它一定存在.如果是这样,请不要让我朝着正确的方向前进. 我正在尝试使用运动数据在 javascript 中创建一个非常标准的组.我有以下对象数组: const myData = [{team: "GSW", pts: 120, ast: 18, reb: 11},{team: "GSW", pts: ..
发布时间:2021-12-27 08:11:42 前端开发

用 MySQL 分组时返回哪一行的字段?

我有一个包含 id 和 string 字段的 MySQL 表.id 是唯一的.strings 是 varchars 并且是非唯一的. 我执行以下查询: SELECT id, string, COUNT( * ) AS 频率发件人表按字符串分组ORDER BY 频率 DESC, id ASC 问题 假设表格包含三行,string 值相同,ids 1、2 和 3. 将返回哪个 i ..
发布时间:2021-12-27 08:11:25 数据库

data.table:表中所有现有组合的总和

我有一个 data.table out 像这样(实际上它要大得多): out 它有 3 个不同代码的组(第 1 列).在#1组中,代码3没有出现,而在另一组中出现. 然后,我想对每个组和代码组合的权重求和.我用这个命令实现了这一点: sum.dt ..
发布时间:2021-12-27 08:11:19 其他开发

Pandas - 计算每列的不同值

我有一个如下所示的数据框: Id ActivityId ActivityCode1 2 31 2 41 3 2 我需要获取与 ID 相关的不同活动 ID 的计数. 在上面的示例中,id 1 将返回 2,因为该 id 有 2 个不同的活动 id. SQL 看起来像这样: SELECT COUNT(DISTINCT ActivityId) FROM table GROUP BY Id ..
发布时间:2021-12-27 08:11:13 Python

按条件和精度从 MySql 中获取百分比

我正要问 MySql 列表并记住了 SO. 运行 MySql 5.0.85,我需要尽可能高效地处理一些查询.如果我能得到一点评论,我将不胜感激. 我收集了数以百万计的数据,需要按一个字段分组前 50 名,以及前 50 名所占的百分比. 这是我想出来的……1)我觉得我可以更有效率,也许加入2) 我怎样才能得到百分数精度的百分比,所以 * 100.00即:.07 变为 7.00,如果 ..
发布时间:2021-12-27 08:10:58 数据库

如何使用 group by 子句选择随机行?

我有下表 SQLFiddle 我试图做的是选择三个随机图像,但要确保没有两个图像具有相同的对象,我试图做的是做一个 GROUP BY 和一个 ORDER BY rand() 但那失败,因为它总是给我 cat1.jpg、dog1.jpg、box1.jpg(路径以 1 结尾的所有图像,而不是其他图像) 小提琴包括我运行的查询以及它是如何不起作用的. 解决方案 你需要的是一个 ..
发布时间:2021-12-27 08:10:51 数据库

如何提高pandas GroupBy过滤操作的性能?

这是我第一次提问. 我正在处理一个大型 CSV 数据集(它包含超过 1500 万行,大小超过 1.5 GB). 我正在将提取物加载到在 Jupyter Notebooks 中运行的 Pandas 数据帧中,以根据数据集导出算法.我按 MAC 地址对数据进行分组,结果为 1+ 百万组. 我的算法开发的核心是运行这个操作: pandas.core.groupby.DataFrame ..
发布时间:2021-12-27 08:10:43 Python

Mysql DateTime 组按 15 分钟

我有一张像这样的桌子 创建表`time_table`(`id` INT(10) NOT NULL AUTO_INCREMENT,`creationDate` 日期时间不为空,主键(`id`)) 我基本上将某些记录的创建时间存储在表中.我知道如果我想获得以 15 分钟为间隔创建的记录的计数,我将使用类似这样的方法 SELECT FLOOR(UNIX_TIMESTAMP(creationDate ..
发布时间:2021-12-27 08:10:35 数据库

GROUP BY 在 SQL 中使用参数

我试图根据预定义的参数下拉列表以某种方式对报告进行分组.我希望能够根据部门或工作代码小计我的报告的总小时数或总工资.我已经创建了参数并且没有问题,我只是不确定是否可以使用这些参数来调用分组命令.以下是我想要的精神,但即使没有参数,GROUP BY 子句对我也不起作用. SELECT EmployeeID, LastName, FirstName, Department, JobCode, Pay ..
发布时间:2021-12-27 08:10:26 其他开发