window-functions相关内容

Spark 窗口函数 - rangeBetween 日期

我有一个包含数据的 Spark SQL DataFrame,我想要获取的是给定日期范围内当前行之前的所有行.因此,例如,我希望在给定行之前拥有 7 天前的所有行.我发现我需要使用 Window Function 像: Window \.partitionBy('id') \.orderBy('开始') 问题来了.我想要一个 rangeBetween 7 天,但我在 Spark 文档中找不到任何 ..

Postgres Wide To Long 按大小写/值

我有一张像: id 分组值1 组 1 是2 组 1 是2 组 2 是3 组 1 是 我已经管理了 id 组 1 组 21 年2 年2 年3 岁 我需要转置 id 组 1 组 21 是 否2 年3 是 否 解决方案 试试这个. SELECT id,MAX(案例分组时 = '组 1'然后'Y'其他'N'完)作为“第 1 组",MAX(案例分组时 = '第 2 组'然后'Y'其他'N'完 ..
发布时间:2021-09-25 19:38:46 其他开发

以行比较为条件的 Postgres 聚合总和

所以,我有看起来像这样的数据 User_Object |文件大小 |创建日期 |删除日期第 1 行 |40 |5 月 10 日 |8月20日第 2 行 |10 |6 月 3 日 |空值第 3 行 |20 |11 月 8 日 |空值 我正在构建统计数据,以根据基于时间的数据点将用户数据使用情况记录到图表中.但是,我很难开发一个查询来获取它之前所有查询的每一行的总和,但仅适用于创建该行时存在的行. ..
发布时间:2021-09-25 19:38:43 其他开发

MYSQL - 警告:#1287 在表达式中设置用户变量已被弃用,并将在未来版本中删除

警告:#1287 在表达式中设置用户变量已被弃用,并将在未来版本中删除.考虑替代方案:“SET variable=expression, ..."或“SELECT expression(s) INTO variables(s)". 这是 MySQL 8.0.21 吐出来的.代码有效......但我也需要它在未来版本中工作......所以我的问题是这个警告的正确方法是什么? 我需要将一个 ..
发布时间:2021-09-25 19:38:40 数据库

MySQL窗口函数每5分钟计算一次平均值或最大值

我有一个表 data,其中包含 clock (unixtime) 和 value 列,其中记录每 50-70 秒出现一次.我需要绘制反映每 5 分钟时间的最大值(或平均值)的月度图表.为此,我需要进行一个查询,每 5 分钟对值进行一次分组和计数.但我就是做不到. SELECT clock, value FROM data WHERE clock BETWEEN 1622667600 AND 16 ..
发布时间:2021-09-25 19:38:28 数据库

PostgreSQL, Window 函数使用问题(附具体例子)

我在 PostgreSQL 中遇到了困难.我正在使用的模式/模型不受我的控制,也不是我能够改变的,所以我试图找出处理我所发牌的最佳方法. 首先,针对此问题简化了架构,但本质上是发票(类型 = T)和交易(类型 T)行合并到同一个表中.每个发票可以并且将会有 n 个交易行和每个客户的 n 个发票可以混合,如下所示. 鉴于此架构: 创建表 t (id 序列主键,类型 VARCHAR (5 ..
发布时间:2021-09-25 19:38:22 其他开发

移动中位数,T-SQL 中的模式

我使用的是 SQL Server 2012,我知道计算移动平均线非常简单.但我需要的是获取像这样定义的窗口框架的模式和中位数(当前行之前的窗口为 2;月份唯一): MONTH |代码 |中位数 |模式1 0 0 02 3 1.5 03 2 2 04 2 2 25 2 2 26 5 2 27 3 3 2 如果有多个值符合模式,则选择第一个. 解决方案 我彻底评论了我的代码.阅读我对我的模 ..
发布时间:2021-09-25 19:38:16 数据库

分区总和不起作用

我有一些关于分区函数的代码,但它不起作用. 我收到一条错误消息,内容为 'Sales' 附近的语法不正确 有人知道为什么吗?看了其他分区问题,没找到答案, 代码(下面)应该从 Aggregated Sales History 表中选择 PriceZoneID 和 Sales,然后使用 OVER 函数总结总销售额,并将该数据放入名为 Total Sales 的新列中. ..
发布时间:2021-09-25 19:38:13 数据库

在 MariaDB 中使用 ROW_NUMBER() 函数的问题

我想在选择表输出中有一个行号列,但是当我尝试使用 ROW_NUMBER() 函数时,MariaDB 会引发语法错误.网上有几个参考资料(http://www.mysqltutorial.org/mysql-window-functions/mysql-row_number-function/ )但到目前为止我还没有成功.这是我的 MariaDB 表的一部分: +----------------- ..
发布时间:2021-09-25 19:38:11 其他开发

ROW_NUMBER 查询

我有一张桌子: 行程停止时间-----------------1 1:101 乙 1:161 乙 1:201 乙 1:251 C 1:311 乙 1:402 一 2:102 乙 2:172 C 2:202 乙 2:25 我想在查询输出中再添加一列: 行程停止时序-------------------------1 1:10 11 乙 1:16 21 乙 1:20 21 乙 1:25 21 C ..
发布时间:2021-09-25 19:38:02 数据库

具有每月偏移量的熊猫滚动()函数

我正在尝试在带有月度数据的 Pandas 数据框上使用滚动 () 函数.但是,我删除了一些 NaN 值,所以现在我的时间序列中有一些差距.因此,基本窗口参数给出了一个误导性的答案,因为它只是查看了之前的观察结果: 将pandas导入为pd将 numpy 导入为 np随机导入dft = pd.DataFrame(np.random.randint(0,10,size=len(dt)),index= ..
发布时间:2021-09-25 19:37:59 Python