presto相关内容

Presto SQL过滤器字符串的一部分Java

我在col1中有一个字符串select col1 from table "blah blah 123 blah iterate 866 loss blah blah" 如何筛选iterate 和loss 之间的字符串并仅显示所有此类筛选数字的总和? 推荐答案 您可以使用regexp_extract提取该字符串中的数字,将值转换为数值类型并求和: WITH t(v) A ..
发布时间:2022-08-31 19:04:15 其他开发

确定连续和独立的PTO天数

根据反馈,我正在调整我的问题。 我正在Presto数据库上使用SQL。 我的目标是报告自2018年初以来连续几天PTO或病假的员工。我想要的输出将是员工所用的各个时间岛以及开始和结束日期,如下所示: 我使用的主表是d_Employee_Time_Off 只有两个TIME_OFF_TYPE_NAME:PTO和病假。 DS是一个日期戳,我使用最新的DS(通常是当前日期) ..
发布时间:2022-08-31 18:56:14 其他开发

在S3中查询Presto中的JSON文件

我在S3中有一个文件,Presto在EMR上运行。我明白了,我可以使用json_Extract来读取json。 我正在运行以下查询,但是,我总是看到空值而不是正确值。 select json_extract('s3a://random-s3-bucket/analytics/20210221/myjsonfile.json', '$.dateAvailability') 我看到此输 ..
发布时间:2022-08-31 18:44:26 其他开发

Presto自定义UDF

我已经创建了一个已注册的自定义UDF,但当我尝试选择CUSTOM_UDF(10)时,收到以下错误: Exact implementation of BasicPlatform do not match expected java types 这是我的UDF,我似乎不知道它出了什么问题: 公共类ScalarUdf{ private ScalarUdfs() {}; @ScalarFuncti ..
发布时间:2022-08-31 18:29:18 Java开发

如何在Presto SQL中进行左连接?

我无论如何也想不出Presto中的一个简单的左联接,即使在阅读了文档之后也是如此。我非常熟悉Postgres,并在那里测试了我的查询,以确保我没有明显的错误。请参考以下代码: select * from (select cast(order_date as date), count(distinct(source_order_id)) as prim_orders, ..
发布时间:2022-08-31 18:10:40 其他开发

运行超过日期的总计PRESTO SQL

我正在尝试使用Presto SQL从下面的示例数据中计算一个日期内t和s列的累计总和。 Date | T | S 1/2/19 | 2 | 5 2/1/19 | 5 | 1 3/1/19 | 1 | 1 我想要 Date | T | S | cum_T | cum_S 1/2/19 | 2 | 5 | 2 | 5 2/1/19 | 5 | 1 | 7 ..
发布时间:2022-08-31 17:49:28 其他开发

如何在SQL中创建大量唯一/不同的ID

我有一个有3列的SQL代码。(1)UUID(2)时间戳1(3)时间戳2。我正在尝试创建一个列表,其中包含唯一的UUID和第一个出现的时间戳1。我使用了DISTINCT函数,但它不起作用。谁能帮助理解什么是正确的代码。 谢谢 with raw_data as ( select UUID, cast(datestring as timetamp) as date1 date2 from X ..
发布时间:2022-08-31 17:40:26 其他开发

将Unix纪元时间转换为扩展的ISO8601

我要使用日期处理3个表,但其中一个表包含Unix纪元格式的日期。以下是3个字段的示例: Table1: 2017-02-01T07:58:40.756031Z Table2: 2017-02-07T10:16:46Z Table3: 1489236559 我想转换表3中的日期,以尽可能匹配表2的格式。这是我现在拥有的: SELECT cast(from_unixtime(tstar ..
发布时间:2022-08-23 18:14:27 其他开发

Spark 是否支持子查询?

当我运行这个查询时,我遇到了这种类型的错误 select * from raw_2 where ip NOT IN (select * from raw_1); org.apache.spark.sql.AnalysisException: 查询中不支持的语言功能: select * from raw_2 where ip NOT IN (select * from raw_1)T ..
发布时间:2021-12-28 23:59:30 其他开发

Spark增量加载覆盖旧记录

我需要使用 Spark (PySpark) 对表进行增量加载 示例如下: 第一天 id |价值-----------1 |美国广播公司2 |定义 第二天 id |价值-----------2 |编码器3 |xyz 预期结果 id |价值-----------1 |美国广播公司2 |编码器3 |xyz 这可以在关系数据库中轻松完成, 想知道这是否可以在 Spark 或其他转 ..
发布时间:2021-12-22 21:36:46 其他开发

Athena/Presto - UNNEST MAP 到列

假设我有一张这样的桌子, 表:qa_list id |question_id |问题 |回答 |---------+--------------+------------+------------——1 |100 |问题1 |回答 |2 |101 |问题2 |回答 |3 |102 |问题3 |回答 |4 |...... |... 以及给出以下结果的查询(因为我找不到转置表的直接方法), ..
发布时间:2021-11-27 08:53:25 其他开发