hiveql相关内容

为什么在Spark和SQL工具中运行'get_json_object'会返回不同的结果

我开发了一个配置单元查询,该查询使用侧面视图和get_json_object来解压一些json.使用hdb数据库的jdbc客户端(dbvisualizer)可以很好地执行查询,但是当从java应用程序以spark sql的形式在相同数据上运行时,该查询不返回任何内容. 我已将问题归结为"get_json_object"函数返回值的差异. 此查询类型可以说明问题 select conca ..
发布时间:2020-09-04 21:50:28 其他开发

如何访问Spark sql中的HIVE ACID表?

如何在Spark sql中访问HIVE ACID表? 解决方案 我们已经研究并开源了一个数据源,该数据源将使用户能够使用Spark处理其Hive ACID事务表. Github: https://github.com/qubole/spark-acid 它可以作为Spark软件包提供,其使用说明在Github页面上.当前,数据源仅支持从Hive ACID表读取,并且我们正在努力增加 ..
发布时间:2020-09-04 19:10:23 其他开发

TBLPROPERTIES('skip.header.line.count'='1')无法在SparkThrift上使用蜂巢jdbc 1.2.1从beeline连接

我正在使用spark 2.3,并将sparkThrift与beeline连接起来. Hive jdbc版本1.2.1 Spark SQL版本2.3.1 我正在尝试创建具有skip header属性的外部表,但是select命令总是返回标题为第一行的数据,以下是我的create查询 CREATE EXTERNAL TABLE datasourcename11( `retail_in ..
发布时间:2020-07-25 18:46:23 其他开发

计算蜂巢中字符串类型的两列之间的时差,而无需更改数据类型字符串

我正在尝试计算具有字符串数据类型的行的两列之间的时间差.如果它们之间的时间差小于2小时,则选择该行的第一列,否则,如果时间差大于2小时,则选择该行的第二列.可以通过将列转换为日期时间格式来完成,但是我希望结果仅在字符串中.我怎样才能做到这一点?数据如下: col1(字符串类型) 2018-07-16 02:23:00 2018-07-26 12:26:00 2018-07-26 15: ..
发布时间:2020-07-23 05:16:01 其他开发

如何在Hive中将int数组的元素连接为字符串

我正在尝试将int数组的元素连接为蜂巢. 函数concat_ws仅适用于字符串数组,因此我尝试了cast(my_int_array as string),但它不起作用. 有什么建议吗? 解决方案 尝试使用/bin/cat进行转换: from mytable select transform(my_int_array) using '/bin/cat' as (my_int ..
发布时间:2020-07-17 21:01:49 其他开发