group-by相关内容
假设我有一个包含在医院就诊的数据集.我的目标是生成一个变量来计算访问者在访问日期之前见过的唯一患者的数量.我经常与 dplyr 的 group_by 一起工作,但这似乎有点棘手.我想我必须使用 group_by、n_distinct 和 sum 或某种移动窗口命令.“目标"变量是我需要的. visitor visitdt 患者目标125469 2018 年 1 月 12 日 15200 1125
..
几天后我将在大学进行一次 SQL 期末考试,我有一个让我发疯的查询!我知道这是一个愚蠢的查询,但我才刚刚开始,无法弄清楚. 所以,基本上有 2 个表,Client 和 Orders. 客户订单--------- ---------PK Client_Id PK Order_Id名称 Client_Id FK合计订单日期 现在,他们让我“列出 2011 年购买最多的客户的姓名" 所
..
我有一个包含 6500 个 players 的数据库,每个玩家平均有 15 个游戏 results. 用例 我想生成一个玩家列表,按照他们的奖品钱的sum排序(结果表中的一个字段).我更喜欢它在某种范围内,所以我还可以过滤玩家所在国家/地区的列表等. 性能 我看到一些帖子提到了 cache_counter 字段以提高性能.就我而言,我有数千条结果记录 (75.000+),所
..
我正在用我的大脑来对抗这个 我有 3 个 SQL Server 2005 表 用户奖励: id、awardamount、userid、dateawarded、awardtypeid 用户: id, firstname, lastname 奖励类型: id, 标题 所以如果 awards 表有行 1, 300.00, 3, 01-01-2011, 12, 125.00, 3
..
我需要一些有关 SUM 功能的帮助.我正在尝试将同一帐户的账单金额合计为一个总计,但我得到的结果显示我的 SUM 列只是将我的第一列乘以 3. 这是我想要的模拟数据结果: AccountNumber Bill BillDate1 100.00 2013 年 1 月 1 日1 150.00 2013 年 2 月 1 日1 200.00 2013 年 3 月 1 日2 75.00 2013 年
..
我很难编写一个 SQL 查询来正确地将 account_no 组合在一起并减去一个金额. 首先我写了这个查询,它更新了一切正常,除了 ACCOUNT_NO A-102 应该以 4500 结束,而不是两个不同的正确余额. 选择 transactions.account_no, account.balance, transactions.amount,(account.balance + tr
..
我有两个表 Orders 和 Order_DetailsOrder_Details 表的 order_id 字段充当 Orders 表的 id_order 表的外键. 我想用 Order_Details 表中的价格总和来更新 Orders 表的 price_total 字段. 我尝试了以下查询但失败了:- 更新订单,Order_DetailsSET Orders.price_tota
..
我在加入表格时遇到问题,这里是示例表格: 表 A:(30 行) ╔════╦════════════╦═════════════╗║ ID ║ 名称 ║ 描述 ║╠════╬════════════╬═════════════╣║ 1 ║ 类型 ║ Unicode 艺术 ║║ 2 ║ 页眉 ║ 电子表格 ║║ 3 ║ 自动对齐 ║ 关闭 ║╚════╩════════════╩══════
..
我正在研究一个高中评分系统. 在我的学校,可以通过修改问题来更改成绩,我将这些更改与日期一起存储. 我有一个函数可以正确返回平均值,因为最近的成绩标有一个值为“1"的“当前"字段.我想让该函数能够返回关于过去日期的最新成绩.我正在绘制他们的平均值随时间变化的图表. 我想做的是这样的: 选择总和(grades.points)从成绩其中日期
..
我的数据如下: 读取日期 |T1 |T2 |2000 年 2 月 15 日 |2 |3 |2000 年 2 月 16 日 |4 |5 |2000 年 3 月 15 日 |2 |3 |2000 年 3 月 16 日 |5 |4 | 我想得到 T1 和 T2 的总和,像这样: 读取日期 |T1 |T2 |02.2000 |6 |8 |03.2000 |7 |7 | 我试着写这样的东西:
..
当我运行以下 SQL 语句时: SELECT MAX(SUM(TIME))从下载按 SSN 分组 它返回客户下载的最大总和值,但是如果我尝试通过将其添加到 select 语句来找到该最大值所属的社会安全号码: SELECT SSN, MAX(SUM(TIME))从下载按 SSN 分组 我收到以下错误: 不是单组群功能 我不明白为什么它会抛出这个错误.谷歌搜索提出了以下操作:
..
我有一个查询,我想查询,它是一个 INSERT FROM a SELECT GROUP BY,但我得到了错误: 错误:INSERT 的目标列多于表达式 第 15 行:插入“KPI_MEASURE"(id、created_at、kpi_project_id、k... _____________________________________^ 提示:插入源是一个行表达式,包含与 INSE
..
我有一张表格,列出了已安装的软件版本: id |用户名 |版本|约会时间----+--------+---------+------------------------111 |75 |10075 |2013-03-12 13:40:58.770112 |75 |10079 |2013-03-12 13:41:01.583113 |78 |10065 |2013-03-12 14:18:24.4
..
我想对数组进行分组. 示例查询: #standardSQLWITH `project.dataset.table` AS (SELECT '计算' 描述,'[{"key":"application","value":"scaled-server"},{"key":"department","value":"hrd"}]' 标签,0.323316成本联合所有SELECT '计算' 描述,'[
..
我的数据看起来像 姓名|来自 |To_City |请求日期 安迪|巴黎 |伦敦|08/21/2014 12:00 莉娜 |科隆 |柏林 |08/22/2014 18:00 安迪|巴黎 |伦敦 |08/22/2014 06:00 丽莎 |罗马 |尼佩尔 |08/25/2014 18:00 莉娜 |罗马 |伦敦 |08/21/2014 20:00 丽莎 |罗马
..
我的表有两列,id 和 a.id 列包含一个数字,a 列包含一个字符串数组.我想计算给定数组的唯一 id 数,数组之间的相等性被定义为“每个索引的大小相同,字符串相同". 当使用 GROUP BY a 时,我得到 不允许按 ARRAY 类型的表达式分组.我可以使用类似 GROUP BY ARRAY_TO_STRING(a, ",") 的东西,但是两个数组 ["a,b"] 和 ["a","b"
..
假设我有一个这样的表(按日期排序): id |姓名 |类型 |日期1 |一个 |1 |01-08-20122 |一个 |2 |01-08-20123 |乙 |1 |02-09-20124 |一个 |1 |01-10-20125 |一个 |4 |01-10-20126 |一个 |5 |02-10-2012 我想对具有相同“名称"值的后续行进行分组并对其进行计数: 名称 |数数一个 |2乙 |1
..
我正在尝试在一个查询中进行左连接,但似乎我在某处错了. 桌机--------------机器ID无条码路由代码名称表日志-------------登录ID行条码机器条码 在日志表中有关于机器和线路的记录.在一条线上可以有许多不同的机器和同一类型的机器. 机器类型是routingCode,所以我有兴趣选择该行中的所有机器并将它们分组.只有具有不同routingCode的机器才应该单独显示,我想
..
我有一个包含两列 ID 和活动的数据框.活动为 0 或 1.我想要一个包含自上次活动为 1 以来不断增加的数字的新列.但是,计数应仅在一个组 (ID) 内.如果活动为 1,则计数列应重置为 0,然后重新开始计数. 所以,我有一个包含以下内容的数据框: 想要的是这个: 有人可以帮我吗? 解决方案 我们在这里使用了一个新的段 'G' df['G']=df.groupby('
..
在给定一组约束的情况下,我希望从查询中得到两件事: 第一场比赛 匹配总数 我可以通过以下方式获得第一场比赛: SELECT TOP 1ID,报告年,名称,签署日期,...发件人表在哪里...ORDER BY ...//我可以把我想拿的放在这里 然后我可以得到匹配计数,如果我使用 SELECTMIN(ID),MIN(报告年),MIN(姓名),MIN(签名日期),... ,COUN
..