hiveql相关内容

如果托管表和外部表具有相同的位置,删除托管表是否会删除外部表?

在相同位置创建托管表和外部表。 当您删除内部表时,数据文件会发生什么情况? 是否会对外部表或外部表的文件位置造成问题? 推荐答案 该表是一个元数据,其中包含列规范、位置路径、表类型、SerDe、统计信息、授权等。删除位置文件夹或文件不会删除该表,只会删除数据。配置单元中的表和数据是松散连接的,这非常方便,因为您不仅可以使用配置单元管理数据,还可以在由其他一些工具生成的现有数据之上创建 ..
发布时间:2022-04-04 19:44:53 其他开发

配置单元-如何使用来自原始表的分区以SELECT方式创建表(&Q)?

我需要从我们的配置单元DLK创建一个“工作表”。而我可以使用: create table my_table as select * from dlk.big_table 很好,我在继承原始“BIG_TABLE”中的分区(属性day、month和year)或仅从这些属性创建新分区时遇到了问题。 搜索网络并没有真正帮助我回答这个问题--所有的“教程”或解决方案要么涉及create as se ..
发布时间:2022-04-04 19:40:24 其他开发

如何检查配置单元CLI中的设置?

我希望在hive命令中运行配置单元查询,并且希望使其更快,因此我运行: hive:messages> set mapred.job.priority = VERY_HIGH; hive:messages> set hi = 1; 但我发现实际上我可以将任何字符串设置为配置单元中的任何字符串,所以我想知道是否有方法可以检查我所做的所有设置? 推荐答案 若要列出当前配置单元会话中 ..
发布时间:2022-04-04 19:38:12 其他开发

使用缺省值创建配置单元表

我在RDBMS中有一个表,如下所示: create table test (sno number, entry_date date default sysdate). 现在我要在配置单元中创建一个表,其结构为向列添加默认值。 推荐答案 配置单元目前不支持创建表时向任何列添加默认值的功能。 作为一种解决办法,可以将数据临时加载到临时表中,并使用INSERT OVERWRITE ..
发布时间:2022-04-04 19:36:14 其他开发

转义配置单元函数Get_json_Object中的子运算符

我有一个包含JSON格式数据的字符串列的表。然后,我使用函数get_json_object来解析其中的一些数据。问题是我的一个字段的名称中包含.。因此,如果以纯文本形式编写字段名,该函数会将其解释为子运算符。 以下是一个有效的示例代码: select get_json_object(col, '$.rootkey') from (select '{"rootkey":15,"key.a ..
发布时间:2022-04-04 12:43:12 其他开发

插入带有特殊字符的配置单元表格内容-制表符和换行符

我正在尝试从根据WHERE子句筛选的配置单元表格中选择具有特殊字符的数据,特别是Tab和NewLine。我已尝试 我已尝试like '%\n%'、like '%\t%'、like '%hex(9)%'等,但它们似乎不起作用。 还试图创建一个虚表来插入这样的数据,但也不起作用。请帮帮忙。 推荐答案 使用rlike '\t'表示制表符,rlike '\n'表示换行符(使用双反斜 ..
发布时间:2022-03-31 11:47:36 其他开发

配置单元中的时间戳解析

我正在尝试读取时间戳,并根据我的要求(在配置单元中)以不同的格式重新构建它。但是,我似乎记不清月份和日期。我怀疑时间戳格式不正确,但不确定哪里出错了。 查询 select from_unixtime(unix_timestamp("Sun Mar 28 19:51:10 GMT+05:30 2021", "EEE MMM dd HH:mm:ss z YYYY"), "HH:mm:ss ..
发布时间:2022-02-22 09:26:56 其他开发

自定义 Mapper 和 Reducer 与 HiveQL

问题陈述:- 我需要比较两个表 Table1 和 Table2 并且它们都存储相同的东西.所以我需要比较 Table2 和 Table1 因为 Table1 是需要进行比较的主表.因此,在比较之后,我需要报告 Table2 存在某种差异.这两张表有很多数据,大约 TB 的数据.所以目前我已经编写了 HiveQL 来进行比较并取回数据. 所以我的问题是在 PERFORMANCE 方面哪个 ..
发布时间:2022-01-13 23:57:11 其他开发

如何使用列类型 Timestamp 创建外部 Hive 表

我想从 HDFS 中包含 epoch 的文本文件创建一个外部 Hive 表.假设该文件位于 /user/me/test.txt.这是文件内容: 13541839211354183922 我已经安装了 Hive 0.8.1 并且应该能够使用类型 Timestamp,所以我创建了表: 蜂巢>创建外部表 test1(纪元时间戳)位置'/用户/我'; 然后我查询了表: SELECT * FROM ..
发布时间:2022-01-13 09:33:19 其他开发

如何在蜂巢中获得毫秒精度?

文档说时间戳支持以下转换: •浮点数值类型:解释为 UNIX 时间戳,以秒为单位,精度为小数 首先,我不知道如何解释.如果我有一个时间戳 2013-01-01 12:00:00.423,我可以将其转换为保留毫秒的数字类型吗?因为这就是我想要的. 更一般地说,我需要在时间戳之间进行比较,例如 从 mytable 中选择 maxts - mints 作为延迟 其中 maxts 和 ..
发布时间:2022-01-13 09:12:17 其他开发

在 Hive 查询中面临生成缺失日期的问题

我有一个要求,我需要返回一列的先前值直到 1000 行,并为我的下一步获取先前的 1000 个日期,但是表中的该列不存在所有这 1000 个先前的日期.但我需要那些缺失的日期才能从查询的输出中获取. 当我尝试在查询下运行时,它没有显示当前日期的 1000 个以前的日期值. 示例:假设只有 2 个日期可用于日期列 日期2019-01-162019-01-19 我想出了一个查询来取回 ..
发布时间:2022-01-11 14:38:06 其他开发