hiveddl相关内容

如果托管表和外部表具有相同的位置,删除托管表是否会删除外部表?

在相同位置创建托管表和外部表。 当您删除内部表时,数据文件会发生什么情况? 是否会对外部表或外部表的文件位置造成问题? 推荐答案 该表是一个元数据,其中包含列规范、位置路径、表类型、SerDe、统计信息、授权等。删除位置文件夹或文件不会删除该表,只会删除数据。配置单元中的表和数据是松散连接的,这非常方便,因为您不仅可以使用配置单元管理数据,还可以在由其他一些工具生成的现有数据之上创建 ..
发布时间:2022-04-04 19:44:53 其他开发

我们如何使用 hive 获得 1000 个表的描述?

我有1000张表,需要一一查看describe ;.不是一个一个运行,你能不能给我一个命令来一次获取“N"个表. 解决方案 查询 Metastore 演示 蜂巢 创建数据库 my_db_1;创建数据库 my_db_2;创建数据库 my_db_3;创建表 my_db_1.my_tbl_1 (i int);创建表 my_db_2.my_tbl_2 (c1 string,c2 d ..
发布时间:2021-12-28 23:32:00 其他开发

如何使用 Hive 使用单个 hdfs 路径创建 n 个外部表

是否可以使用 Hive 创建 n 个指向单个 hdfs 路径的外部表.如果是,有什么优点和局限性. 解决方案 可以在 HDFS 的同一位置上创建多个表(同时托管和外部). 在相同数据之上创建具有完全相同架构的表根本没有用,但是您可以创建具有不同列数的不同表,例如使用 RegexSerDe 创建具有不同解析列的不同表,因此您可以有不同的这些表中的模式.您可以对 Hive 中的这些表拥有 ..
发布时间:2021-12-28 23:14:11 其他开发

使用一个文件在 Hive 中创建表

我正在使用以下命令在 Hive 中创建一个新表: CREATE TABLE new_table AS select * from old_table; 我的问题是在创建表后,它为每个分区生成多个文件 - 而我只需要每个分区一个文件. 如何在表格中定义它?谢谢! 解决方案 有很多可能的解决方案: 1) 在查询的末尾添加 distribute by partition key. ..

与 hive 中的外部表混淆

我使用以下命令创建了 hive 外部表: 使用 hive2;创建外部表 depTable (depId int comment 'This is the unique id for each dep', depName string,location string) comment '部门表' 行格式以“,"结尾的分隔字段存储为文本文件位置“/dataDir/"; 现在,当我查看 HDFS ..
发布时间:2021-12-15 18:45:58 其他开发

蜂巢删除所有分区保留最近4天的分区

我有一个分区如下的表: TABLE logs PARTITION(year = 2019, month = 06, day = 18) 分区'year','month'和'day'均为字符串格式. 我需要删除分区,保留最近7天的分区. 并且需要每周运行一次作业,以便日志表在每周开始时会有7天的日志. 解决方案 您可以在分区规范中使用 ..
发布时间:2020-11-23 07:05:29 其他开发

蜂巢中的位置

在创建配置单元表时,我可以将"LOCATION"指向hdfs中存在数据的位置.我还是需要加载数据,还是可以直接在Hive上获取数据? 解决方案 您可以在创建表时指定任何位置,并且可以访问数据.如果表已分区,则使用ALTER TABLE ADD PARTITION或MSCK REPAIR TABLE table_name或Amazon版本ALTER TABLE table_name RECO ..
发布时间:2020-11-22 19:28:56 其他开发

是否可以在Hive CREATE TABLE语句本身中为传入的数据指定日期/时间戳格式?

我有一个CSV文件,其中包含以下格式的日期和时间戳记值。例如: Col1 | col2 01JAN2019 | 01JAN2019:17:34:41 但是当我在create语句中将Col1定义为Date并将Col2定义为Timestamp时,Hive表仅返回 NULL 当我查询时。 如果不存在则创建外部表my_schema.my_table (Col1日期, ..
发布时间:2020-10-11 03:40:58 其他开发