presto - IT屋-程序员软件开发技术分享社区

Presto SQL过滤器字符串的一部分Java

我在col1中有一个字符串select col1 from table "blah blah 123 blah iterate 866 loss blah blah" 如何筛选iterate 和loss 之间的字符串并仅显示所有此类筛选数字的总和？推荐答案您可以使用regexp_extract提取该字符串中的数字，将值转换为数值类型并求和： WITH t(v) A ..

发布时间：2022-08-31 19:04:15 sql presto trino 其他开发

确定连续和独立的PTO天数

根据反馈，我正在调整我的问题。我正在Presto数据库上使用SQL。我的目标是报告自2018年初以来连续几天PTO或病假的员工。我想要的输出将是员工所用的各个时间岛以及开始和结束日期，如下所示：我使用的主表是d_Employee_Time_Off 只有两个TIME_OFF_TYPE_NAME：PTO和病假。 DS是一个日期戳，我使用最新的DS(通常是当前日期) ..

发布时间：2022-08-31 18:56:14 sql presto 其他开发

在S3中查询Presto中的JSON文件

我在S3中有一个文件，Presto在EMR上运行。我明白了，我可以使用json_Extract来读取json。我正在运行以下查询，但是，我总是看到空值而不是正确值。 select json_extract('s3a://random-s3-bucket/analytics/20210221/myjsonfile.json', '$.dateAvailability') 我看到此输 ..

发布时间：2022-08-31 18:44:26 amazon-s3 presto trino json-extract 其他开发

如何在Presto中将数字格式化为带有两个小数位的百分比？

我有一个数字要将其格式化为Presto中的百分比。我想将0.18932格式化为18.93%。我已尝试： format('%s%%', decimal_number*100) format('%s%%', round((a.decimal_number*100), 2)) 结果如下：无格式：0.019435618 第一种方法：1.9435618000% 第二种方式：1.94000 ..

发布时间：2022-08-31 18:36:21 format decimal percentage presto trino 其他开发

Presto自定义UDF

我已经创建了一个已注册的自定义UDF，但当我尝试选择CUSTOM_UDF(10)时，收到以下错误： Exact implementation of BasicPlatform do not match expected java types 这是我的UDF，我似乎不知道它出了什么问题：公共类ScalarUdf{ private ScalarUdfs() {}; @ScalarFuncti ..

发布时间：2022-08-31 18:29:18 java presto Java开发

带冒号(：)的Amazon Athena分区不起作用

在Athena中创建分区时，我尝试使用(yyyy-MM-ddTHH：MM：SSZ)格式的日期，但无法查询数据第一步：创建表 CREATE EXTERNAL TABLE my_info ( id STRING, name STRING ) PARTITIONED BY ( part string ) STORED AS ORC LOC ..

发布时间：2022-08-31 18:21:06 presto amazon-athena 其他开发

如何在Presto SQL中进行左连接？

我无论如何也想不出Presto中的一个简单的左联接，即使在阅读了文档之后也是如此。我非常熟悉Postgres，并在那里测试了我的查询，以确保我没有明显的错误。请参考以下代码： select * from (select cast(order_date as date), count(distinct(source_order_id)) as prim_orders, ..

发布时间：2022-08-31 18:10:40 presto 其他开发

Presto SQL透视(因为没有更好的词)数据

我正在处理Presto数据库中的一些课程数据。表中的数据如下所示： student_id period score completed 1 2016_Q1 3 Y 1 2016_Q3 4 Y 3 2017_Q1 4 Y 4 2018_Q1 2 N 我要格式化数据， ..

发布时间：2022-08-31 17:58:57 sql presto 其他开发

运行超过日期的总计PRESTO SQL

我正在尝试使用Presto SQL从下面的示例数据中计算一个日期内t和s列的累计总和。 Date | T | S 1/2/19 | 2 | 5 2/1/19 | 5 | 1 3/1/19 | 1 | 1 我想要 Date | T | S | cum_T | cum_S 1/2/19 | 2 | 5 | 2 | 5 2/1/19 | 5 | 1 | 7 ..

发布时间：2022-08-31 17:49:28 sql presto 其他开发

如何在SQL中创建大量唯一/不同的ID

我有一个有3列的SQL代码。(1)UUID(2)时间戳1(3)时间戳2。我正在尝试创建一个列表，其中包含唯一的UUID和第一个出现的时间戳1。我使用了DISTINCT函数，但它不起作用。谁能帮助理解什么是正确的代码。谢谢 with raw_data as ( select UUID, cast(datestring as timetamp) as date1 date2 from X ..

发布时间：2022-08-31 17:40:26 sql presto 其他开发

如何在雅典娜的字符串数据类型上提取月份名称

SELECT sales_invoice_date, MONTH( DATE_TRUNC('month', CASE WHEN TRIM(sales_invoice_date) = '' THEN DATE('1999-12-3 ..

发布时间：2022-08-23 18:20:30 sql presto amazon-athena 其他开发

将Unix纪元时间转换为扩展的ISO8601

我要使用日期处理3个表，但其中一个表包含Unix纪元格式的日期。以下是3个字段的示例： Table1: 2017-02-01T07:58:40.756031Z Table2: 2017-02-07T10:16:46Z Table3: 1489236559 我想转换表3中的日期，以尽可能匹配表2的格式。这是我现在拥有的： SELECT cast(from_unixtime(tstar ..

发布时间：2022-08-23 18:14:27 datetime hadoop presto amazon-athena 其他开发

如何在Presto Athena中将varchar转换为数组

我的数据为VARCHAR格式。我想拆分这个数组的两个元素，这样就可以从JSON中提取一个键值。数据格式 [ { "skuId": "5bc87ae20d298a283c297ca1", "unitPrice": 0, "id": "5bc87ae20d298a283c297ca1", "quantity": "1" }, { "s ..

发布时间：2022-08-23 17:55:04 arrays json presto amazon-athena trino 其他开发

配置单元将json记录解析为空

我有一个简单的蜂窝表： hive> show create table tweets; OK CREATE EXTERNAL TABLE `tweets`( `json_body` string COMMENT 'from deserializer') ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe' STORED ..

发布时间：2022-04-04 19:46:42 json hive hiveql presto hiveddl 其他开发

Spark 是否支持子查询?

当我运行这个查询时，我遇到了这种类型的错误 select * from raw_2 where ip NOT IN (select * from raw_1); org.apache.spark.sql.AnalysisException: 查询中不支持的语言功能: select * from raw_2 where ip NOT IN (select * from raw_1)T ..

发布时间：2021-12-28 23:59:30 hadoop apache-spark hive presto 其他开发

Spark增量加载覆盖旧记录

我需要使用 Spark (PySpark) 对表进行增量加载示例如下: 第一天 id |价值-----------1 |美国广播公司2 |定义第二天 id |价值-----------2 |编码器3 |xyz 预期结果 id |价值-----------1 |美国广播公司2 |编码器3 |xyz 这可以在关系数据库中轻松完成，想知道这是否可以在 Spark 或其他转 ..

发布时间：2021-12-22 21:36:46 apache-spark pyspark etl presto 其他开发

如何在 Presto 中交叉连接取消嵌套 JSON 数组

给定一个包含一列 JSON 的表，如下所示: {"payload":[{"type":"b","value":"9"}, {"type":"a","value":"8"}]}{"payload":[{"type":"c","value":"7"}, {"type":"b","value":"3"}]} 如何编写 Presto 查询以提供所有条目的平均 b 值? 到目前为止，我认为我需要使 ..

发布时间：2021-12-15 19:18:06 json hadoop hive presto 其他开发

在 Amazon Athena (Presto) 中投射无法正常工作?

我有一个医生执照注册数据集，其中包括每位医生的 total_submitted_charge_amount 以及医疗保险和医疗保险的权利数量.医疗补助.我使用了下面建议的答案中的查询: 带数据集市 AS(选择 npi，provider_last_name,provider_first_name，provider_mid_initial,provider_address_1,provider_a ..

发布时间：2021-11-27 08:53:55 amazon-web-services amazon-s3 presto amazon-athena 其他开发

如何将实际上是带时区的日期的字符串转换为 Presto 中的时间戳?

示例:2017-12-24 23:59:59.000 PST 这不起作用 select date_parse('2017-12-24 23:59:59.000 PST','%Y-%m-%d %T.%f %x') 当然我可以截断 TZ 来解决 select date_parse(substr('2017-12-24 23:59:59.000 PST',1,23),'%Y-%m-%d %T ..

发布时间：2021-11-27 08:53:36 hive amazon-athena presto 其他开发

Athena/Presto - UNNEST MAP 到列

假设我有一张这样的桌子，表:qa_list id |question_id |问题 |回答 |---------+--------------+------------+------------——1 |100 |问题1 |回答 |2 |101 |问题2 |回答 |3 |102 |问题3 |回答 |4 |...... |... 以及给出以下结果的查询(因为我找不到转置表的直接方法)， ..

发布时间：2021-11-27 08:53:25 presto amazon-athena 其他开发

presto相关内容