amazon-athena 第7页 - IT屋-程序员软件开发技术分享社区

S3选择定价如何工作?在s3 select中返回和扫描的数据是什么

我有100万行CSV数据.选择10行，是否会向我收取10行费用.在S3 Select中返回的数据和扫描的数据是什么? 关于S3 select的这些条款的文档较少解决方案为使事情变得简单，请忘记S3以列方式读取的一段时间.假设您有以下数据: |城市|最后更新日期|| ------------ | --------------------- ||伦敦|1月1日||伦敦|1月2日| ..

发布时间：2021-04-03 18:38:34 amazon-web-services amazon-s3 amazon-athena presto amazon-s3-select 其他开发

AWS DMS:如何在Presto/Athena中处理TIMESTAMP_MICROS拼花地板字段

当前，我们有一个DMS任务，该任务将获取MySQL DB的内容并将文件以镶木地板格式转储到S3. 实木复合地板中时间戳的格式最终为TIMESTAMP_MICROS. 这是Presto(雅典娜的基本实现)的问题不支持以毫秒为单位的时间戳，并假设所有时间戳都以毫秒为单位. 这不会直接导致任何错误，但会因为将微秒数解释为毫秒数而使时间显示为某个极端的未来日期. 我们目前正在解决此 ..

发布时间：2021-04-03 18:38:30 amazon-web-services parquet presto amazon-athena aws-dms 其他开发

Presto检查是否为NULL并返回默认值(NVL模拟)

Presto DB中是否有NVL的类似物? 我需要检查字段是否为NULL并返回默认值. 我这样解决这个问题: SELECT案件当my_field为null时，则为0ELSE my_field结尾来自my_table 但是我很好奇是否有可以简化此代码的东西. 解决方案 ISO SQL函数是 COALESCE coalesce(my_field，0) https:/ ..

发布时间：2021-04-03 18:38:27 sql presto amazon-athena 其他开发

如何在AWS Athena中将行透视成列?

我是AWS Athena的新手，它尝试将一些行转换为列，类似于此 ..

发布时间：2021-04-03 18:38:25 sql amazon-web-services pivot amazon-athena 其他开发

输入数据格式更改时，雅典娜会将数据放入不正确的列中

我们在S3的文件夹中有一些用管道分隔的.txt报告，我们在其上运行Glue搜寻器以确定架构并在Athena中进行查询. 报告的格式最近发生了变化，因此中间有两个新列. 旧文件: 列A B C D E F数据a1 b1 c1 d1 e1 f1 带有"G"和"H"列的新文件: 列A B G H C D E F数据a2 b2 g2 h2 c2 d2 e2 f2 我们在爬网程序创建 ..

发布时间：2021-04-03 18:38:22 amazon-web-services amazon-athena aws-glue 其他开发

雅典娜/普雷斯托-UNNEST MAP至专栏

假设我有一个这样的表，表格:"qa_list" id |问题ID |问题回答|--------- + -------------- + ------------ + --------------1 |100 |第1个问题|回答|2 |101 |第2个问题|回答|3 |102 |第3个问题|回答|4 |...... |... 和给出以下结果的查询(因为我找不到直接的方式来转置表格)， ..

发布时间：2021-04-03 18:38:19 presto amazon-athena 其他开发

AWS Athena(Presto)如何将地图转置为列

AWS Athena查询问题；我在行中有一个嵌套的映射，我想将键转换为列.我可以像 items ['label_a'] 这样明确地命名列，但是在这种情况下，键实际上是动态的... 从这些行: {id = 1，items = {label_a = foo，label_b = foo}}{id = 2，项目= {label_a = bar，label_c = bar}}{id = 3 ..

发布时间：2021-04-03 18:38:16 presto amazon-athena 其他开发

Amazon Athena将字符串转换为日期

我希望将以下字符串: mmm-dd-yyyy 转换为日期: yyyy-mm-dd 例如 2015年11月6日至2015年11月6日在Amazon Athena内解决方案我会做date_parse.相应地调整您的正则表达式. 选择date_parse('2015年11月6日，'％b-％d-％Y') 2015-11-06 00:00:00.000 re ..

发布时间：2021-04-03 18:38:13 amazon-athena 其他开发

aws athena-通过json对象数组创建表

我可以在AWS Athena上创建表方面获得帮助吗?有关数据的示例示例: [{“" lts“:150}] AWS Glue将模式生成为: 数组(array>) 当我尝试使用AWS Glue创建的表预览表时，出现此错误: HIVE_BAD_DATA:解析字段0的字段值时出错:org.openx.data.jsonserde.json.JSONOb ..

发布时间：2021-04-03 18:38:10 json amazon-web-services amazon-athena aws-glue 其他开发

雅典娜presto-多列从长到宽

我是Athena的新手，我试图了解如何将多列从长格式转换为宽格式.似乎需要 presto ，但是我只能成功地将 map_agg 应用于一个变量.我认为使用 multimap_agg 可以达到我的最终结果，但不能完全起作用. 下面，我逐步介绍我的步骤和数据.如果您有任何建议或问题，请告诉我！首先，数据开始如下: id |信|编号|价值------------------------ ..

发布时间：2021-04-03 18:38:07 sql pivot window-functions presto amazon-athena 其他开发

由于QuickSight可以直接查询S3，我们什么时候需要使用Athena作为QuickSight的数据源?

可能是我遗漏了一些东西，但是我无法理解如果将Athena与QuickSight连接而不是将QuickSight与S3直接连接会带来什么好处.请帮助我理解这一点. 解决方案 Amazon S3是一种对象存储，旨在存储和检索任意数量的数据.基本上，它具有一些原始数据或非结构化数据(某些文件格式为 .csv 或 .tsv ). Amazon Athena使用托管数据目录来存储信息和有关为数 ..

发布时间：2021-04-03 18:37:39 amazon-s3 amazon amazon-athena amazon-quicksight 其他开发

在Athena中查询可选的嵌套JSON字段

我有看起来像的json数据: { "col1" : 123, "metadata" : { "opt1" : 456, "opt2" : 789 } } 其中各种元数据字段(其中有很多)是可选的，可能会也可能不会出现. 我的查询是: select col1, metadata.opt1 from "db-name".tablename 如果任何行中都不存在opt1，我希望 ..

发布时间：2021-02-13 20:24:38 json amazon-web-services aws-glue amazon-athena 其他开发

使用Presto从数据构造json

如果我在表中有如下数据 WITH dataset AS ( SELECT ARRAY[ CAST(ROW('Bob', 38) AS ROW(name VARCHAR, age INTEGER)), CAST(ROW('Alice', 35) AS ROW(name VARCHAR, age INTEGER)), CAST(ROW('Jane', 27) AS R ..

发布时间：2020-11-23 05:10:00 sql json hierarchical-data presto amazon-athena 其他开发

Amazon AWS Athena HIVE_CANNOT_OPEN_SPLIT:打开Hive拆分时出错/无效的Parquet文件，使用Athena的Parquet文件压缩为gzip

我正在尝试在Amazon Athena上建立技能. 我已经成功使用Athena查询JSON和Apache Parquet格式的数据. 我现在想做的是向其中添加压缩(gzip). 我的JSON数据: { "id": 1, "prenom": "Firstname", "nom": "Lastname", "age": 23 } 然后，我使用npm模块将 ..

发布时间：2020-11-21 23:47:28 amazon-web-services gzip parquet amazon-athena 其他开发

AWS胶粘作业将字符串映射为日期和时间格式，同时从CSV转换为拼花

在从csv转换为镶木地板时，使用csv中映射的字段后的AWS粘合ETL作业读取为日期和时间类型的字符串。这是实际的csv文件在映射和转换后，提交的日期为空，时间与今天的日期连接在一起如何使用正确的日期和时间格式进行转换？解决方案它使用presto数据类型，因此数据应采用正确的格式 DATE日历日期（年，月，日）。示例：日期'2001-08-22' ..

发布时间：2020-10-31 00:01:24 amazon-s3 etl parquet amazon-athena aws-glue 其他开发

将数据从AWS Athena导入RDS实例

当前，我正在侦听来自AWS Kinesis的事件并将其写入S3。然后，我使用AWS Glue和Athena查询它们。是否可以通过一些转换将数据导入RDS实例？解决方案关于该任务有几种通用方法。将数据和Athena查询读取到自定义ETL脚本中（使用 JDBC连接）并加载到数据库中安装S3存储桶将数据保存到文件系统（可能使用 s3fs-fuse ），然后使用自定义ETL ..

发布时间：2020-10-30 23:58:27 amazon-s3 etl amazon-rds amazon-athena 其他开发

如何使用Simba ODBC连接到Amazon Athena

我正在尝试使用DBI :: dbConnect从RStudio连接到Athena，并且在打开驱动程序时遇到问题。 con< ;-DBI :: dbConnect（ odbc :: odbc（），驱动程序=“ [[Simba Athena ODBC驱动程序]]”， S3OutputLocation =“ [s3：// bucket-文件夹/]”， AwsRegion =“ [区域 ..

发布时间：2020-10-19 02:53:29 amazon-web-services odbc amazon-athena dbi simba 其他开发

如何使用Boto3 get_query_results方法从AWS Athena创建数据框

我正在使用AWS Athena查询来自S3的原始数据。由于Athena将查询输出写入S3输出存储桶，所以我经常这样做： df = pd.read_csv（OutputLocation）但这似乎是一种昂贵的方法。最近，我注意到 boto3 的 get_query_results 方法返回一个复杂的结果字典。 client = boto3.client（'athe ..

发布时间：2020-10-16 23:33:21 python pandas amazon-web-services dataframe amazon-athena Python

AWS Glue爬网程序创建分区和文件表

我有一个非常基本的s3设置，我想使用Athena进行查询.数据全部存储在一个存储桶中，并分为年/月/日/小时文件夹. |--data | |--2018 | | |--01 | | | |--01 | | | | |--01 | | | | | |--file1.json | | | | | |--file2.j ..

发布时间：2020-09-15 19:11:01 amazon-web-services amazon-s3 amazon-athena aws-glue 其他开发

更改雅典娜桌子的位置时，分区位置是否会自动更改?

我已经创建了一个表测试，并且该表的位置是s3://mocktest/test 现在，我想将表格位置更新为s3://mocktest/test-new 所以我用ALTER TABLE test set LOCATION s3://mocktest/test-new查询位置会在测试表中更新，但不会在分区表中更新. "MSCK REPAIR TABLE"命令无法用于更新分区解决方案 ..

发布时间：2020-08-22 21:56:05 amazon-athena 其他开发

amazon-athena相关内容