amazon-athena相关内容

我应该使用雅典娜视图为QuickSight进行连接,还是应该在QuickSight中进行连接?

我有一大堆Athena表,这些表是由我持续输入到S3中的数据生成的,我想将这些数据用于QuickSight。 我取得了一些成功,但对于一些数据,我在刷新QS时会超时。我是更好地在Athena中创建视图来执行所有连接等操作,然后将其插入到QS中进行报告,还是应该将基表插入到QS中并在那里进行连接和其他数据操作? 推荐答案 雅典娜视图不是实例化视图,因此它们对您没有好处。 https ..

将Unix纪元时间转换为扩展的ISO8601

我要使用日期处理3个表,但其中一个表包含Unix纪元格式的日期。以下是3个字段的示例: Table1: 2017-02-01T07:58:40.756031Z Table2: 2017-02-07T10:16:46Z Table3: 1489236559 我想转换表3中的日期,以尽可能匹配表2的格式。这是我现在拥有的: SELECT cast(from_unixtime(tstar ..
发布时间:2022-08-23 18:14:27 其他开发

雅典娜VS红移光谱

我在评估雅典娜&红移光谱。两者都有相同的目的,Spectrum需要一个适当的红移集群,而雅典娜则是纯粹的无服务器。雅典娜使用Presto,Spectrum使用其RedShift引擎 雅典娜或红移光谱有什么特别的缺点吗? 使用Athena或Spectrum有什么限制吗? 推荐答案 我在几个不同的用例中使用了这两种方法,结论是: 红移光谱的优势: 允许创建红移表 能够连 ..

AWS QuickSight计算的字段平均值

您好,我在计算这个字段时遇到了问题。我正在尝试获得每个客户密钥的Money_Val之和。然后我想要有一个KPI视觉显示平均Money_Val。我发现PRE_AGG和PRE_FILTER给出了错误的值,所以我想使用POST_AGG_FILTER。 sumOver(sum({money_val}),[customerkey], POST_AGG_FILTER) 但当我将其放入KPI可视化的V ..

我是否可以将Athena View用作AWS胶水作业的来源?

我正在尝试使用雅典娜视图作为我的AWS胶水作业的数据源。我在尝试运行Glue作业时收到的错误消息与视图的分类有关。我能把它定义为什么呢? 谢谢您 Error Message Appearing 推荐答案 您可以使用Athena JDBC driver。这种方法绕过了目录,因为只有Athena(而不是2019年1月25日的Glue)可以直接访问视图。 下载驱动程序并将JAR存 ..
发布时间:2022-05-28 12:09:50 其他开发

AWS雅典娜-合并小镶木地板文件还是离开它们?

我有很多通过AWS Glue读取到雅典娜的小镶木地板文件。我知道小拼图文件(每个35K左右,取决于日志输出它们的方式)并不理想,但一旦它们被读取到数据目录中,它还重要吗? 换句话说,在加载到Athena之前,我是否应该完成将所有小镶木地板文件合并为更理想大小的文件的练习? 推荐答案 即使在数据目录中注册了小文件,您也要继续为它们付出代价。当您基于许多小文件查询一个表时,Athen ..
发布时间:2022-05-11 22:35:55 其他开发

在AirFlow 2.0中运行多个雅典娜查询

我正在尝试创建一个DAG,其中一个任务使用boto3执行athena查询。它对一个查询有效,但是当我尝试运行多个雅典娜查询时遇到问题。 此问题可以按如下方式解决:- 翻阅thisblog可以看到,athena使用start_query_execution触发查询,get_query_execution获取status、queryExecutionId等查询数据(athena的文档) ..
发布时间:2022-03-12 19:18:11 Python

具有日期序列的交叉连接红移

我想用红移来跟踪雅典娜查询,但到目前为止还不可能重现它。查询应该在CREATE TABLE AS ()语句中调用,因此GENERATE_SEQUENCE()思想可能不起作用。有什么想法吗? 雅典娜查询: SELECT * FROM table_one t1 CROSS JOIN UNNEST(slice(sequence(t1.effective_date, t1.expira ..
发布时间:2022-03-02 09:15:01 其他开发

PowerBI Folding on Native Query 基于 AWS Athena 查询-增量刷新

我正在尝试确定 AWS Athena 查询是否成功折叠在 PowerBI 中的本机查询上,以便设置增量刷新.我创建了参数,根据这些参数过滤了我的日期时间列并尝试了诊断工具(请参阅 https://www.youtube.com/watch?v=QEFze-LdLqo 从 4:50 开始),但它会继续运行并且不显示任何结果.所以,我正在尝试在高级编辑器中查询的方法 (https://www.yout ..
发布时间:2022-01-10 17:19:42 其他开发

在同一个 Cloudformation Stack 中连接 Athena 和 S3

从文档中,AWS::Athena::NamedQuery,不清楚如何将 Athena 附加到同一堆栈中指定的 S3 存储桶. 如果我不得不从 example,我想你可以写一个模板, 资源:我的S3Bucket:类型:AWS::S3::Bucket... 其他参数 ...AthenaNamedQuery:类型:AWS::Athena::NamedQuery特性:数据库:“db_name"名称 ..

输入数据格式更改时,Athena 将数据放在错误的列中

我们有一些管道分隔的 .txt 报告进入 S3 中的一个文件夹,我们在该文件夹上运行 Glue 爬虫来确定 Athena 中的架构和查询. 报告的格式最近发生了变化,因此中间有两个新列. 旧文件: 列 A B C D E F数据 a1 b1 c1 d1 e1 f1 具有额外“G"和“H"列的新文件: 列 A B G H C D E F数据 a2 b2 g2 h2 c2 d2 e2 ..
发布时间:2021-11-27 08:54:15 其他开发

AWS Athena MSCK REPAIR TABLE 表名命令

这个命令有多少个我们期望的分区 MSCK 修复表表名; 失败? 我有一个系统,目前有超过 27k 个分区,我们删除了 Athena 表的架构更改,重新创建表,并说新列添加到末尾,然后运行 MSCK 修复表表名; 我们每次运行 5 小时后,都无法使用此命令执行任何工作.没有添加一个分区.想知道是否有人知道我们可能已达到但无法在任何地方找到记录的分区限制的信息. 解决方案 MSC ..
发布时间:2021-11-27 08:54:04 其他开发