presto相关内容
我在col1中有一个字符串select col1 from table "blah blah 123 blah iterate 866 loss blah blah" 如何筛选iterate 和loss 之间的字符串并仅显示所有此类筛选数字的总和? 推荐答案 您可以使用regexp_extract提取该字符串中的数字,将值转换为数值类型并求和: WITH t(v) A
..
根据反馈,我正在调整我的问题。 我正在Presto数据库上使用SQL。 我的目标是报告自2018年初以来连续几天PTO或病假的员工。我想要的输出将是员工所用的各个时间岛以及开始和结束日期,如下所示: 我使用的主表是d_Employee_Time_Off 只有两个TIME_OFF_TYPE_NAME:PTO和病假。 DS是一个日期戳,我使用最新的DS(通常是当前日期)
..
我在S3中有一个文件,Presto在EMR上运行。我明白了,我可以使用json_Extract来读取json。 我正在运行以下查询,但是,我总是看到空值而不是正确值。 select json_extract('s3a://random-s3-bucket/analytics/20210221/myjsonfile.json', '$.dateAvailability') 我看到此输
..
我有一个数字要将其格式化为Presto中的百分比。我想将0.18932格式化为18.93%。 我已尝试: format('%s%%', decimal_number*100) format('%s%%', round((a.decimal_number*100), 2)) 结果如下: 无格式:0.019435618 第一种方法:1.9435618000% 第二种方式:1.94000
..
我已经创建了一个已注册的自定义UDF,但当我尝试选择CUSTOM_UDF(10)时,收到以下错误: Exact implementation of BasicPlatform do not match expected java types 这是我的UDF,我似乎不知道它出了什么问题: 公共类ScalarUdf{ private ScalarUdfs() {}; @ScalarFuncti
..
在Athena中创建分区时,我尝试使用(yyyy-MM-ddTHH:MM:SSZ)格式的日期,但无法查询数据 第一步:创建表 CREATE EXTERNAL TABLE my_info ( id STRING, name STRING ) PARTITIONED BY ( part string ) STORED AS ORC LOC
..
我无论如何也想不出Presto中的一个简单的左联接,即使在阅读了文档之后也是如此。我非常熟悉Postgres,并在那里测试了我的查询,以确保我没有明显的错误。请参考以下代码: select * from (select cast(order_date as date), count(distinct(source_order_id)) as prim_orders,
..
我正在处理Presto数据库中的一些课程数据。表中的数据如下所示: student_id period score completed 1 2016_Q1 3 Y 1 2016_Q3 4 Y 3 2017_Q1 4 Y 4 2018_Q1 2 N 我要格式化数据,
..
我正在尝试使用Presto SQL从下面的示例数据中计算一个日期内t和s列的累计总和。 Date | T | S 1/2/19 | 2 | 5 2/1/19 | 5 | 1 3/1/19 | 1 | 1 我想要 Date | T | S | cum_T | cum_S 1/2/19 | 2 | 5 | 2 | 5 2/1/19 | 5 | 1 | 7
..
我有一个有3列的SQL代码。(1)UUID(2)时间戳1(3)时间戳2。我正在尝试创建一个列表,其中包含唯一的UUID和第一个出现的时间戳1。我使用了DISTINCT函数,但它不起作用。谁能帮助理解什么是正确的代码。 谢谢 with raw_data as ( select UUID, cast(datestring as timetamp) as date1 date2 from X
..
SELECT sales_invoice_date, MONTH( DATE_TRUNC('month', CASE WHEN TRIM(sales_invoice_date) = '' THEN DATE('1999-12-3
..
我要使用日期处理3个表,但其中一个表包含Unix纪元格式的日期。以下是3个字段的示例: Table1: 2017-02-01T07:58:40.756031Z Table2: 2017-02-07T10:16:46Z Table3: 1489236559 我想转换表3中的日期,以尽可能匹配表2的格式。这是我现在拥有的: SELECT cast(from_unixtime(tstar
..
我的数据为VARCHAR格式。我想拆分这个数组的两个元素,这样就可以从JSON中提取一个键值。 数据格式 [ { "skuId": "5bc87ae20d298a283c297ca1", "unitPrice": 0, "id": "5bc87ae20d298a283c297ca1", "quantity": "1" }, { "s
..
我有一个简单的蜂窝表: hive> show create table tweets; OK CREATE EXTERNAL TABLE `tweets`( `json_body` string COMMENT 'from deserializer') ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe' STORED
..
当我运行这个查询时,我遇到了这种类型的错误 select * from raw_2 where ip NOT IN (select * from raw_1); org.apache.spark.sql.AnalysisException: 查询中不支持的语言功能: select * from raw_2 where ip NOT IN (select * from raw_1)T
..
我需要使用 Spark (PySpark) 对表进行增量加载 示例如下: 第一天 id |价值-----------1 |美国广播公司2 |定义 第二天 id |价值-----------2 |编码器3 |xyz 预期结果 id |价值-----------1 |美国广播公司2 |编码器3 |xyz 这可以在关系数据库中轻松完成, 想知道这是否可以在 Spark 或其他转
..
给定一个包含一列 JSON 的表,如下所示: {"payload":[{"type":"b","value":"9"}, {"type":"a","value":"8"}]}{"payload":[{"type":"c","value":"7"}, {"type":"b","value":"3"}]} 如何编写 Presto 查询以提供所有条目的平均 b 值? 到目前为止,我认为我需要使
..
我有一个医生执照注册数据集,其中包括每位医生的 total_submitted_charge_amount 以及医疗保险和医疗保险的权利数量.医疗补助.我使用了下面建议的答案中的查询: 带数据集市 AS(选择 npi,provider_last_name,provider_first_name,provider_mid_initial,provider_address_1,provider_a
..
示例:2017-12-24 23:59:59.000 PST 这不起作用 select date_parse('2017-12-24 23:59:59.000 PST','%Y-%m-%d %T.%f %x') 当然我可以截断 TZ 来解决 select date_parse(substr('2017-12-24 23:59:59.000 PST',1,23),'%Y-%m-%d %T
..
假设我有一张这样的桌子, 表:qa_list id |question_id |问题 |回答 |---------+--------------+------------+------------——1 |100 |问题1 |回答 |2 |101 |问题2 |回答 |3 |102 |问题3 |回答 |4 |...... |... 以及给出以下结果的查询(因为我找不到转置表的直接方法),
..