hiveql相关内容

从给定的输入生成最高数字,并使用配置单元将0替换为9

有人能帮助/建议我如何处理配置单元中的以下情况吗? 我有一列包含一些值,其中一些数字(在6位数字之后)后有0,我需要将所有这些0替换为9。如果我在5位数字之后有0,那么我需要在开始时包括0,然后再次需要替换6位数字后的0。PFB一些样本记录和预期输出。 Input output 1234560000000 ..
发布时间:2022-08-09 21:48:10 其他开发

蜂窝与CTE连接

有人能帮我在下面的查询中添加注释联接条件吗?如果我正在执行此查询,则此查询工作正常,但当我尝试添加另一个联接代码时,它无法访问列HIGH_V2,并给出列/表ALISA NOT FOUND问题。 with MYTABLE as ( select T1.LOW_V2 as LOW_V2, T2.LOW_V as LOW_V, T2.HIGH_V as HIGH_V from T ..
发布时间:2022-08-09 21:43:52 其他开发

在配置单元中使用子字符串和LPAD/RPAD替换数字

大家好 有人帮我在配置单元中实现了以下逻辑。我在配置单元中有2个表(表1,表2)。我需要在满足某些条件的情况下将Table1的一列中的0替换为9,并需要生成一个输出列,然后生成与Table2列(High列)相同的输出列。我将从Table2列(High列)联接,并将从这两个表生成输出。 table1 SCHEME_1 LOW_1 01 12340000 0 ..
发布时间:2022-08-09 21:32:56 其他开发

在配置单元中排除最少6位数字并替换尾随数字

有人能帮我在蜂窝里写下下面的逻辑吗? 我在列中有一个值,其中我的数字尾随0。我需要将所有这些0替换为9,同时将0替换为9,同时我还需要考虑在9之前至少应该有6位数字,否则需要排除一些0,这样在9之前可以至少有6位数字。PFB某些情况。 1234506600000000000 在这里,我们可以看到尾随0之前的位数是8(12345066),所以我只需要将0除以9,输出将如下所示。12345 ..
发布时间:2022-08-09 21:19:57 其他开发

将HIVE-1.0时间戳截断为秒,并将格式从";yyyy:mm:dd:ss.sss";更改为";yyyy:mm:DD:ss";

基本标题: 我正在寻找一种合理的方法,仅使用hive-1.0语法来截断时间戳中的毫秒字段。 我正在考虑的超级幼稚的方法是: cast(from_unixtime(second(cast([TIMESTAMP_IN_QUESTION] as string)), "yyyy:mm:dd:ss"), as timestamp) 但我相信这包括末尾毫秒字段上的.00。 有没有一 ..
发布时间:2022-07-05 13:20:58 其他开发

Union All不会在配置单元中生成任何数据

我尝试为三个具有相同DDL结构的不同表执行Union all,但最终输出生成零行。我对潜在的行刑中发生的事情一无所知。有人能分享你对这件事的看法吗?我的示例配置单元SQL如下所示。谢谢。 SET hive.execution.engine=tez; SET hive.exec.dynamic.partition.mode=nonstrict; SET hive.qubole. ..
发布时间:2022-07-05 13:13:10 其他开发

如何将查询的输出存储在配置单元的变量中

我想将CURRENT_DAY-1存储在Hive中的一个变量中。我知道已经有关于此主题的以前的帖子,但那里提供的解决方案首先建议在外壳环境中的配置单元外部定义变量,然后在配置单元内部使用该变量。 Storing result of query in hive variable 我首先使用 获取了Current_Date select date_sub(FROM_UNIXTIME(U ..
发布时间:2022-07-05 13:04:21 其他开发

如何在蜂窝中显示小数点?

我希望在配置单元中显示DECIMAL数据类型的小数精度和结果。但是,如果没有小数部分,则在配置单元中不会显示小数点。 hive> select cast(11 as decimal(14,2)); 11 hive> select cast(11.22 as decimal(14,2)); 11.22 在上面的示例中,它应该显示11.00,而不是11。如何实现这一点? 请帮帮忙。 ..
发布时间:2022-04-04 20:13:44 其他开发

从字符串中提取键值对

我不熟悉配置单元,正在尝试运行一个查询,其中一列(col1)被描述为类型字符串,并包含诸如{color=blue, name=john, size=M}这样的键值对。我正在尝试提取一些值,以便可以执行类似于返回col1包含COLOR=BLUE的所有行的操作。 我一直在尝试使用get_json_object,但我认为这不是正确的方法,因为我不确定从技术上讲,该字段是否为json数组。 推 ..
发布时间:2022-04-04 20:12:18 其他开发

用最接近的值填充表中缺少的日期值的配置单元SQL查询

我花了几天时间试图弄清楚如何在配置单元中将丢失的日期与最接近的值相加,但没有运气。我需要基于环境约束使用配置单元SQL来实现这一点。原始表当前类似于下表。 account name,available balance,Date of balance Peter,50000,2021-05-24 Peter,50035,2021-05-25 Peter,50035,2021-05-26 P ..
发布时间:2022-04-04 20:10:54 其他开发

将Greenplum SQL语句迁移到HiveSQL

我们正在将Greenplum迁移到HiveSQL,请帮助我,因为以下语句需要转换。请帮帮我们。 GREENPLUM - ||trim(to_char(sum(revenue),'9,999,999,999')) 配置单元将不支持to_char,因此我们必须在配置单元中放入相等属性。 推荐答案 您可以使用cast(col as STRING)转换为字符,并使用format_nu ..
发布时间:2022-04-04 20:08:24 其他开发

用于左连接的蜂窝偏斜缓解

我有一个典型的影响左外部联接性能的不对称问题(左表很大,右表很小)。不对称的密钥主要是空的(很长一段时间),其次是&键X和键。 我尝试了几种不同的方法: 在偏斜的键上添加连接谓词";is Not Null";似乎没有任何明显的影响。此外,我还需要处理 我使用hive.Optimize.skewJoin的结果好坏参半 我在几篇文章中提到的关键腌制技术非常有效(速度快3 ..
发布时间:2022-04-04 20:04:53 其他开发

配置单元SQL查询,用于用日期范围内最近的值填充表中缺少的日期值

对于下面的示例,如果我使用下面相同的数据,并且如果我希望Mary和Peter帐户在相同的日期范围内,我将如何修改配置单元SQL查询来执行此操作?例如,将日期范围设置在‘2021-05-24’和‘2021-06-03’之间,并填写此期间的所有余额。如果我们以Mary为例,我还希望看到Mary可用余额‘53028.1’向前填充到‘2021-06-03’,并且如果Mary没有‘2021-05-24’的值 ..
发布时间:2022-04-04 19:59:52 其他开发

HIVE是否会同时使用分区条件而不是分区条件执行全表查询?

我有一个由一个日期列名datetime分区的配置单元表 如果我执行类似 的查询 select * from table where datetime = "2021-05-01" and id in (1,2) 如果有额外的and id in (1,2)条件,配置单元是否会执行全表搜索? 是否可以通过explain结果确定? 推荐答案 分区清理应该可以正常工作。为了 ..
发布时间:2022-04-04 19:57:49 其他开发