hiveql 第17页 - IT屋-程序员软件开发技术分享社区

配置单元动态分区

我正在尝试使用动态分区创建分区表，但是我遇到了一个问题.我正在Hortonworks Sandbox 2.0上运行Hive 0.12. set hive.exec.dynamic.partition=true; INSERT OVERWRITE TABLE demo_tab PARTITION (land) SELECT stadt, geograph_breite, id, t.count ..

发布时间：2020-11-22 01:46:44 hadoop hive hiveql 其他开发

蜂巢:合并配置设置不起作用

在Hive 2.2.0上，我使用查询从另一个大小为1.34 GB的源表中填充一个兽人表 INSERT INTO TABLE TableOrc SELECT * FROM Table; ---- (1) 该查询使用6个orc文件创建TableORC表，这些文件比256MB的块大小小得多. -- FolderList1 -rwxr-xr-x user1 supergroup 6 ..

发布时间：2020-11-22 01:45:29 hadoop hive hiveql orc hive-configuration 其他开发

获取当前日期并将其设置为变量，以便将其用作HIVE中的表名

我想获取当前日期为YYMMDD，然后将其设置为变量，以便将其用作表名. 这是我的代码: set dates= date +%Y-%m-%d; CREATE EXTERNAL TABLE IF NOT EXISTS dates( id STRING, region STRING, city STRING) 但是该方法不起作用，因为似乎分配是错误的.有什么主意吗 ..

发布时间：2020-11-22 01:44:20 variables hadoop hive hiveql 其他开发

蜂巢-分层组上的多个(平均)计数差异

给出以下源数据(假设表名称为user_activity): +---------+-----------+------------+ | user_id | user_type | some_date | +---------+-----------+------------+ | 1 | a | 2018-01-01 | | 1 | a ..

发布时间：2020-11-21 00:34:11 sql hive group-by hiveql 其他开发

蜂巢：如何使用地图列爆炸表格

我有一张这样的桌子 + ----- + ---------- -------------------- + | id | mapCol | + ----- + ------------------------------ ++ | id1 | {key1：val1，key2：val2} | | id2 | {key1：val3，key2：val4} | + ----- ..

发布时间：2020-10-21 22:34:19 java dictionary hive hiveql user-defined-functions Java开发

如何在Hive中将时间戳（秒和毫秒之间的点）转换为日期（yyyyMMdd）？

我想将时间戳，例如 1490198341.705 转换为日期 20170323 并转换为小时 11 （GMT + 8：00）。有解决此问题的功能吗？解决方案请尝试以下操作： select date_format（from_utc_timestamp（1490198341.705，'GMT + 8：00'），'yyyyMMdd HH：mm：ss'）; ..

发布时间：2020-10-18 06:00:43 date hadoop time hive hiveql 其他开发

迄今为止的字符串-Hive SQL

我在配置单元环境中运行查询。我有一列带有时间戳，但在表中设置了一个字符串。我尝试了以下操作：全部返回Null SELECT ，To_date（activitydate）投射：，强制转换（以活动日期作为时间戳记）这是在表中设置数据的方式：赞赏我如何进行转换： 05/12 / 2017 00:00:00 ..

发布时间：2020-10-18 05:53:23 sql string date hive hiveql 其他开发

配置单元日期/时间戳列

我有一些试图通过配置单元查询的HDFS数据。数据采用逗号分隔的文本文件的形式。文件中的列之一是日期/时间列，如下所示： Wed Aug 29 16:16:58 CDT 2018 当我尝试读取使用以下脚本创建的Hive表时，得到的值为NULL 使用test_db; 放置表ORDERS; 创建外部表ORDERS（ SAMPLE_DT_TM TIMESTAM ..

发布时间：2020-10-18 05:38:51 date hadoop hive hiveql 其他开发

配置单元外部表指向带有嵌入式双引号的CSV文件

我正在尝试创建一个指向CSV文件的外部Hive表。我的CSV文件中有一列（col2），该列值中可能包含双引号和逗号。每列中的数据： Col1：150 Col2：BATWING，ABC“ D”测试数据 Col3：300 CSV格式的行： 150，“ BATWING，ABC”“ D”“测试数据”，300 创建表DDL ： ..

发布时间：2020-10-12 20:53:00 csv hadoop hive hiveql 其他开发

是否可以在Hive CREATE TABLE语句本身中为传入的数据指定日期/时间戳格式？

我有一个CSV文件，其中包含以下格式的日期和时间戳记值。例如： Col1 | col2 01JAN2019 | 01JAN2019：17：34：41 但是当我在create语句中将Col1定义为Date并将Col2定义为Timestamp时，Hive表仅返回 NULL 当我查询时。如果不存在则创建外部表my_schema.my_table （Col1日期， ..

发布时间：2020-10-11 03:40:58 hive timestamp hiveql create-table hiveddl 其他开发

HIVE-插入覆盖vs删除表+创建表+插入

我正在对蜂巢中的几个查询执行一些自动脚本，我们发现需要时间来清除表中的数据并插入新的。并且我们在考虑什么会更快？插入覆盖表SOME_TABLE SELECT * FROM OTHER_TABLE; ，或者这样做更快： DROP TABLE SOME_TABLE; CREATE TABLE SOME_TABLE（STUFFS）; 插入表 SELECT ..

发布时间：2020-10-11 03:37:45 hive hiveql create-table 其他开发

用Hive计算Text变量的单词频率

我有一个变量，每一行都是一个句子。示例： -Row1“嘿，你好吗？ -Rwo2”那里？我希望输出的结果是逐字计数。示例：嘿2 1 是1 的样子... 我正在使用分割功能，但是有点卡住了。对此有任何想法吗？谢谢！解决方案这是可能的在蜂巢。按非字母字符分割并使用横向视图+爆炸，然后计算单词： ..

发布时间：2020-10-10 20:47:15 hadoop text hive counter hiveql 其他开发

将多个列合并为一个配置单元

我需要将列值连接到单个列中。我在变量中有列名，如 colnames = col1，col2，col3 。我正在从unix外壳编写以下查询，并调用配置单元。但是，当我这样做时，我得到的只是列名，而不是那些列的值。 select concat（'regexp_replace （“ $ {colnames}”，“，”，“ ^”））作为表的结果；我希望输出为： ..

发布时间：2020-10-07 19:56:36 string shell hive concatenation hiveql 其他开发

失败：ParseException行1:21无法识别“< EOF>”附近的输入'< EOF>' '< EOF>'在表格名称中

命令： hive -e“使用xxx;如果存在xxx.flashsaleeventproducts_hist`，则删除表；创建外部表` xxx.flashsaleeventproducts_hist`（“ event_id”字符串，“ group_code”字符串，“ id”字符串，“ is_deleted” int，“ price” int，`price_guide` int，`produ ..

发布时间：2020-10-06 01:35:01 sql command-line hive escaping hiveql 其他开发

Hive 1.1中的时间戳记问题

我在生产环境（cloudera 5.5）中的配置单元中遇到一个非常奇怪的问题，这在我的本地服务器中基本上是不可复制的（不知道为什么），即对于某些记录，我从临时表中插入时时间戳值错误插入时将字符串“ 2017-10-21 23”转换为主表，并将其转换为时间戳“ 2017-10-21 23:00:00”数据类型。示例： 2017-10-21 23-> ; 2017-10-21 22 ..

发布时间：2020-10-03 00:26:27 hive hiveql cloudera cloudera-cdh 其他开发

添加缺少的每月行

例如，我想列出请求中两个日期之间的缺失日期我的数据： YEAR_MONTH |金额 202001 | 500 202001 | 600 201912 | 100 201910 | 200 201910 | 100 201909 | 400 201601 | 5000 我希望请求返回 201912 | 100 201911 | ..

发布时间：2020-09-29 21:09:01 sql hive cassandra hiveql 其他开发

如何将一个分区的数据插入/复制到Hive中的多个分区？

我的配置单元表中有 day ='2019-01-01'的数据，我想将相同的数据复制到整个2019年1月。（即'2019-01-02'，'2019-01-03' ... '2019-01-31'）我正在尝试关注，但数据仅插入到'2019-01-02 '，而不是在'2019-01-03'中。插入覆盖表db_t.students PARTITION（dt ='2019-01 -02'， ..

发布时间：2020-09-28 22:25:50 hive calendar hiveql hive-partitions 其他开发

Hive查询在生成缺失日期时面临的问题

我有一个要求，我需要返回到一列的以前的值直到1000行，并为下一步获取以前的1000个日期，但是表中该列不存在所有这些1000个以前的日期。但是我需要那些缺少的日期才能从查询的输出中获取。当我尝试在查询下运行时，它不显示当前日期的1000个以前的日期值。 p> 示例：假设日期列中只有2个日期 date 2019-01-16 2019-01-19 我来 ..

发布时间：2020-09-28 22:06:42 date hive calendar hiveql 其他开发

配置单元按不可见列排序

假设我的表test的列为a,b，而c和test2的列相同.我可以创建表测试的视图并将测试2连接在一起并按表测试中的字段c排序，而不在最终输出中显示它吗?就我而言: CREATE VIEW AS test_view AS SELECT a,b FROM (SELECT * FROM test ORDER BY c) JOIN test2 ON test.a =test2.a; 好吧，我测试 ..

发布时间：2020-09-20 19:34:55 hive bigdata hiveql 其他开发

HiveQL中的变量

背景: 作为现代化工作的一部分，我试图将一个大型存储过程转换为HiveQL脚本.每当从Azure Data Factory触发管道时，作为蜂巢活动的一部分的HiveQL脚本便会在Azure HDInsight群集上运行. 我要转换的存储过程有很多使用'DECLARE'语句声明的变量.例如: DECLARE @Variable1 INT; 这些变量中的值是使用SELECT语句设 ..

发布时间：2020-09-16 23:20:49 variables hive hiveql azure-data-factory azure-hdinsight 其他开发

hiveql相关内容