hiveql相关内容

配置单元动态分区

我正在尝试使用动态分区创建分区表,但是我遇到了一个问题.我正在Hortonworks Sandbox 2.0上运行Hive 0.12. set hive.exec.dynamic.partition=true; INSERT OVERWRITE TABLE demo_tab PARTITION (land) SELECT stadt, geograph_breite, id, t.count ..
发布时间:2020-11-22 01:46:44 其他开发

迄今为止的字符串-Hive SQL

我在配置单元环境中运行查询。 我有一列带有时间戳,但在表中设置了一个字符串。我尝试了以下操作:全部返回Null SELECT ,To_date(activitydate) 投射: ,强制转换(以活动日期作为时间戳记) 这是在表中设置数据的方式: 赞赏我如何进行转换: 05/12 / 2017 00:00:00 ..
发布时间:2020-10-18 05:53:23 其他开发

配置单元日期/时间戳列

我有一些试图通过配置单元查询的HDFS数据。数据采用逗号分隔的文本文件的形式。文件中的列之一是日期/时间列,如下所示: Wed Aug 29 16:16:58 CDT 2018 当我尝试读取使用以下脚本创建的Hive表时,得到的值为NULL 使用test_db; 放置表ORDERS; 创建外部表ORDERS( SAMPLE_DT_TM TIMESTAM ..
发布时间:2020-10-18 05:38:51 其他开发

是否可以在Hive CREATE TABLE语句本身中为传入的数据指定日期/时间戳格式?

我有一个CSV文件,其中包含以下格式的日期和时间戳记值。例如: Col1 | col2 01JAN2019 | 01JAN2019:17:34:41 但是当我在create语句中将Col1定义为Date并将Col2定义为Timestamp时,Hive表仅返回 NULL 当我查询时。 如果不存在则创建外部表my_schema.my_table (Col1日期, ..
发布时间:2020-10-11 03:40:58 其他开发

HIVE-插入覆盖vs删除表+创建表+插入

我正在对蜂巢中的几个查询执行一些自动脚本,我们发现需要时间来清除表中的数据并插入新的。并且我们在考虑什么会更快? 插入覆盖表SOME_TABLE SELECT * FROM OTHER_TABLE; ,或者这样做更快: DROP TABLE SOME_TABLE; CREATE TABLE SOME_TABLE(STUFFS); 插入表 SELECT ..
发布时间:2020-10-11 03:37:45 其他开发

用Hive计算Text变量的单词频率

我有一个变量,每一行都是一个句子。 示例: -Row1“嘿,你好吗? -Rwo2”那里? 我希望输出的结果是逐字计数。 示例: 嘿2 1 是1 的样子... 我正在使用分割功能,但是有点卡住了。对此有任何想法吗? 谢谢! 解决方案 这是可能的在蜂巢。按非字母字符分割并使用横向视图+爆炸,然后计算单词: ..
发布时间:2020-10-10 20:47:15 其他开发

将多个列合并为一个配置单元

我需要将列值连接到单个列中。 我在变量中有列名,如 colnames = col1,col2,col3 。 我正在从unix外壳编写以下查询,并调用配置单元。但是,当我这样做时,我得到的只是列名,而不是那些列的值。 select concat('regexp_replace (“ $ {colnames}”,“,”,“ ^”))作为表的结果; 我希望输出为: ..
发布时间:2020-10-07 19:56:36 其他开发

Hive 1.1中的时间戳记问题

我在生产环境(cloudera 5.5)中的配置单元中遇到一个非常奇怪的问题,这在我的本地服务器中基本上是不可复制的(不知道为什么),即对于某些记录,我从临时表中插入时时间戳值错误插入时将字符串“ 2017-10-21 23”转换为主表,并将其转换为时间戳“ 2017-10-21 23:00:00”数据类型。 示例: 2017-10-21 23-> ; 2017-10-21 22 ..
发布时间:2020-10-03 00:26:27 其他开发

添加缺少的每月行

例如,我想列出请求中两个日期之间的缺失日期 我的数据: YEAR_MONTH |金额 202001 | 500 202001 | 600 201912 | 100 201910 | 200 201910 | 100 201909 | 400 201601 | 5000 我希望请求返回 201912 | 100 201911 | ..
发布时间:2020-09-29 21:09:01 其他开发

Hive查询在生成缺失日期时面临的问题

我有一个要求,我需要返回到一列的以前的值直到1000行,并为下一步获取以前的1000个日期,但是表中该列不存在所有这些1000个以前的日期。但是我需要那些缺少的日期才能从查询的输出中获取。 当我尝试在查询下运行时,它不显示当前日期的1000个以前的日期值。 p> 示例:假设日期列中只有2个日期 date 2019-01-16 2019-01-19 我来 ..
发布时间:2020-09-28 22:06:42 其他开发

配置单元按不可见列排序

假设我的表test的列为a,b,而c和test2的列相同.我可以创建表测试的视图并将测试2连接在一起并按表测试中的字段c排序,而不在最终输出中显示它吗?就我而言: CREATE VIEW AS test_view AS SELECT a,b FROM (SELECT * FROM test ORDER BY c) JOIN test2 ON test.a =test2.a; 好吧,我测试 ..
发布时间:2020-09-20 19:34:55 其他开发

HiveQL中的变量

背景: 作为现代化工作的一部分,我试图将一个大型存储过程转换为HiveQL脚本.每当从Azure Data Factory触发管道时,作为蜂巢活动的一部分的HiveQL脚本便会在Azure HDInsight群集上运行. 我要转换的存储过程有很多使用'DECLARE'语句声明的变量.例如: DECLARE @Variable1 INT; 这些变量中的值是使用SELECT语句设 ..