amazon-athena - IT屋-程序员软件开发技术分享社区

带冒号(：)的Amazon Athena分区不起作用

在Athena中创建分区时，我尝试使用(yyyy-MM-ddTHH：MM：SSZ)格式的日期，但无法查询数据第一步：创建表 CREATE EXTERNAL TABLE my_info ( id STRING, name STRING ) PARTITIONED BY ( part string ) STORED AS ORC LOC ..

发布时间：2022-08-31 18:21:06 presto amazon-athena 其他开发

我应该使用雅典娜视图为QuickSight进行连接，还是应该在QuickSight中进行连接？

我有一大堆Athena表，这些表是由我持续输入到S3中的数据生成的，我想将这些数据用于QuickSight。我取得了一些成功，但对于一些数据，我在刷新QS时会超时。我是更好地在Athena中创建视图来执行所有连接等操作，然后将其插入到QS中进行报告，还是应该将基表插入到QS中并在那里进行连接和其他数据操作？推荐答案雅典娜视图不是实例化视图，因此它们对您没有好处。 https ..

发布时间：2022-08-23 18:42:31 amazon-web-services amazon-athena amazon-quicksight 其他开发

在AWS Athena中使用serde格式提取json文件中的数组和嵌套数组

我在数组和嵌套数组中逐个提取数据，但我希望使用一条语句(如‘SELECT*’)从数组中提取所有数据它看起来是这样的：而不是写 customerdata.data.balances[8].data.balances[2].date date_29, customerdata.data.balances[8].data.balances[3].date date_29 等我 ..

发布时间：2022-08-23 18:31:06 arrays json amazon-web-services amazon-athena 其他开发

根据Athena查询结果创建CloudWatch指标

我的要求我要根据Athena查询结果创建CloudWatch-Metric。示例我想创建一个类似USER_COUNT的指标。在雅典娜，我将像这样编写SQL查询 select date,count(distinct user) as count from users_table group by 1 在Athena编辑器中，我可以看到结果，但我希望在Cloudwa ..

发布时间：2022-08-23 18:26:47 amazon-web-services amazon-cloudwatch amazon-athena 其他开发

如何在雅典娜的字符串数据类型上提取月份名称

SELECT sales_invoice_date, MONTH( DATE_TRUNC('month', CASE WHEN TRIM(sales_invoice_date) = '' THEN DATE('1999-12-3 ..

发布时间：2022-08-23 18:20:30 sql presto amazon-athena 其他开发

将Unix纪元时间转换为扩展的ISO8601

我要使用日期处理3个表，但其中一个表包含Unix纪元格式的日期。以下是3个字段的示例： Table1: 2017-02-01T07:58:40.756031Z Table2: 2017-02-07T10:16:46Z Table3: 1489236559 我想转换表3中的日期，以尽可能匹配表2的格式。这是我现在拥有的： SELECT cast(from_unixtime(tstar ..

发布时间：2022-08-23 18:14:27 datetime hadoop presto amazon-athena 其他开发

雅典娜VS红移光谱

我在评估雅典娜&红移光谱。两者都有相同的目的，Spectrum需要一个适当的红移集群，而雅典娜则是纯粹的无服务器。雅典娜使用Presto，Spectrum使用其RedShift引擎雅典娜或红移光谱有什么特别的缺点吗？使用Athena或Spectrum有什么限制吗？推荐答案我在几个不同的用例中使用了这两种方法，结论是：红移光谱的优势：允许创建红移表能够连 ..

发布时间：2022-08-23 18:06:28 amazon-web-services amazon-redshift amazon-athena amazon-redshift-spectrum 其他开发

INVALID_TABLE_PROPERTY：对于雅典娜上的输入字符串："；0-23"；(Property：projection.hour.digits)

运行此查询时出错雅典娜查询 SELECT * FROM "db"."thermostat" where id='95686' and "date" = '2022/03/07' AND hour =13 投影分区位于此路径上的数据： S3://bucket/dbname/tablename/id/date=2022/03/07/hour=13/ 错误 INVALI ..

发布时间：2022-08-23 18:01:26 amazon-s3 amazon-athena database-partitioning aws-glue-data-catalog athena 其他开发

如何在Presto Athena中将varchar转换为数组

我的数据为VARCHAR格式。我想拆分这个数组的两个元素，这样就可以从JSON中提取一个键值。数据格式 [ { "skuId": "5bc87ae20d298a283c297ca1", "unitPrice": 0, "id": "5bc87ae20d298a283c297ca1", "quantity": "1" }, { "s ..

发布时间：2022-08-23 17:55:04 arrays json presto amazon-athena trino 其他开发

AWS QuickSight计算的字段平均值

您好，我在计算这个字段时遇到了问题。我正在尝试获得每个客户密钥的Money_Val之和。然后我想要有一个KPI视觉显示平均Money_Val。我发现PRE_AGG和PRE_FILTER给出了错误的值，所以我想使用POST_AGG_FILTER。 sumOver(sum({money_val}),[customerkey], POST_AGG_FILTER) 但当我将其放入KPI可视化的V ..

发布时间：2022-08-21 20:11:27 amazon-web-services dashboard amazon-athena amazon-quicksight kpi 其他开发

我是否可以将Athena View用作AWS胶水作业的来源？

我正在尝试使用雅典娜视图作为我的AWS胶水作业的数据源。我在尝试运行Glue作业时收到的错误消息与视图的分类有关。我能把它定义为什么呢？谢谢您 Error Message Appearing 推荐答案您可以使用Athena JDBC driver。这种方法绕过了目录，因为只有Athena(而不是2019年1月25日的Glue)可以直接访问视图。下载驱动程序并将JAR存 ..

发布时间：2022-05-28 12:09:50 amazon-web-services jobs amazon-athena aws-glue 其他开发

AWS雅典娜-合并小镶木地板文件还是离开它们？

我有很多通过AWS Glue读取到雅典娜的小镶木地板文件。我知道小拼图文件(每个35K左右，取决于日志输出它们的方式)并不理想，但一旦它们被读取到数据目录中，它还重要吗？换句话说，在加载到Athena之前，我是否应该完成将所有小镶木地板文件合并为更理想大小的文件的练习？推荐答案即使在数据目录中注册了小文件，您也要继续为它们付出代价。当您基于许多小文件查询一个表时，Athen ..

发布时间：2022-05-11 22:35:55 amazon-web-services parquet aws-glue amazon-athena 其他开发

在AirFlow 2.0中运行多个雅典娜查询

我正在尝试创建一个DAG，其中一个任务使用boto3执行athena查询。它对一个查询有效，但是当我尝试运行多个雅典娜查询时遇到问题。此问题可以按如下方式解决：- 翻阅thisblog可以看到，athena使用start_query_execution触发查询，get_query_execution获取status、queryExecutionId等查询数据(athena的文档) ..

发布时间：2022-03-12 19:18:11 python airflow boto3 amazon-athena Python

具有日期序列的交叉连接红移

我想用红移来跟踪雅典娜查询，但到目前为止还不可能重现它。查询应该在CREATE TABLE AS ()语句中调用，因此GENERATE_SEQUENCE()思想可能不起作用。有什么想法吗？雅典娜查询： SELECT * FROM table_one t1 CROSS JOIN UNNEST(slice(sequence(t1.effective_date, t1.expira ..

发布时间：2022-03-02 09:15:01 amazon-redshift amazon-athena 其他开发

如何将行转入 AWS Athena 中的列?

我是 AWS Athena 的新手，并试图将一些行转换为列，类似于此 StackOverflow 帖子. 但是，当我尝试时: 选择 column1、column2、column3从数据枢(最小值(第 3 列)FOR column2 IN ('VALUE1','VALUE2','VALUE3','VALUE4')) 我收到错误: mismatched input '(' Expecting ..

发布时间：2022-01-22 21:44:34 sql amazon-web-services pivot amazon-athena 其他开发

PowerBI Folding on Native Query 基于 AWS Athena 查询-增量刷新

我正在尝试确定 AWS Athena 查询是否成功折叠在 PowerBI 中的本机查询上，以便设置增量刷新.我创建了参数，根据这些参数过滤了我的日期时间列并尝试了诊断工具(请参阅 https://www.youtube.com/watch?v=QEFze-LdLqo 从 4:50 开始)，但它会继续运行并且不显示任何结果.所以，我正在尝试在高级编辑器中查询的方法 (https://www.yout ..

发布时间：2022-01-10 17:19:42 powerbi amazon-athena 其他开发

在同一个 Cloudformation Stack 中连接 Athena 和 S3

从文档中，AWS::Athena::NamedQuery，不清楚如何将 Athena 附加到同一堆栈中指定的 S3 存储桶. 如果我不得不从 example，我想你可以写一个模板，资源:我的S3Bucket:类型:AWS::S3::Bucket... 其他参数 ...AthenaNamedQuery:类型:AWS::Athena::NamedQuery特性:数据库:“db_name"名称 ..

发布时间：2021-12-15 20:29:53 amazon-web-services amazon-s3 amazon-cloudformation amazon-athena 其他开发

在 Athena 中查询可选的嵌套 JSON 字段

我有类似于以下内容的 json 数据: { "col1" : 123, "metadata" : { "opt1" : 456, "opt2" : 789 } } 其中各种元数据字段(其中有很多)是可选的，可能存在也可能不存在. 我的查询是: select col1, metadata.opt1 from "db-name".tablename 如果 opt1 不存在于任何行中，我希 ..

发布时间：2021-11-27 08:54:25 json amazon-web-services aws-glue amazon-athena 其他开发

输入数据格式更改时，Athena 将数据放在错误的列中

我们有一些管道分隔的 .txt 报告进入 S3 中的一个文件夹，我们在该文件夹上运行 Glue 爬虫来确定 Athena 中的架构和查询. 报告的格式最近发生了变化，因此中间有两个新列. 旧文件: 列 A B C D E F数据 a1 b1 c1 d1 e1 f1 具有额外“G"和“H"列的新文件: 列 A B G H C D E F数据 a2 b2 g2 h2 c2 d2 e2 ..

发布时间：2021-11-27 08:54:15 amazon-web-services amazon-athena aws-glue 其他开发

AWS Athena MSCK REPAIR TABLE 表名命令

这个命令有多少个我们期望的分区 MSCK 修复表表名；失败? 我有一个系统，目前有超过 27k 个分区，我们删除了 Athena 表的架构更改，重新创建表，并说新列添加到末尾，然后运行 MSCK 修复表表名；我们每次运行 5 小时后，都无法使用此命令执行任何工作.没有添加一个分区.想知道是否有人知道我们可能已达到但无法在任何地方找到记录的分区限制的信息. 解决方案 MSC ..

发布时间：2021-11-27 08:54:04 amazon-s3 amazon-athena 其他开发

amazon-athena相关内容