hive相关内容

配置单元断开的管道错误

INSERT INTO OVERWRITE .... TRANSFORM(... 。)USING'python script.py'FROM .... LEFT OUTER JOIN。 。 。左外连接。 。 。 LEFT OUTER JOIN 开始时一切正常,直到我们加载了大量的虚拟数据。我们只是在一些字段上写下相同的记录,而且变化很小。之后,我们再次运行这个程序,我们得到一个断开的管道错误 ..
发布时间:2018-05-31 20:06:48 分布式计算/Hadoop

使用Hbase配置Hive

我需要使用配置单元在HBase上执行查询。我已经下载了HBase并配置了我的HMaster,运行良好;我需要知道我需要为配置单元使用HBase作为后端数据库进行哪些配置更改。任何链接教程将不胜感激。 在此先感谢。 解决方案 apache Hive wiki很好地解释了它 https://cwiki.apache.org/confluence/display/Hive/HBaseInteg ..
发布时间:2018-05-31 20:05:21 分布式计算/Hadoop

HIVE JDBC ThriftHive $ Client.sendBase

我有Hadoop / hive的工作。我已经安装了hadoop和hive,它在命令提示符下运行良好。我还创建了一个hive的MySQL元存储。我已经在hive-site.xml文件中定义了HIVE-DB数据库名称。同名数据库可用于MySQL> HIVE-DB。但是,在命令提示符下创建的表在mysql命令提示符中不可用。 当我想创建一个配置单元jdbc连接,然后得到以下错误..首先它是我的程序创建 ..
发布时间:2018-05-31 20:04:26 Java开发

理论上可以在配置单元中使用并置连接(a-la-netezza)吗?

当您连接分布在同一个键上的表并在联接条件中使用这些键列时,netezza中的每个SPU(机器)都会独立于另一个工作(参见 nz-interview )。 在配置单元中,有 bucketed地图连接,但是将表示这些表的文件分配给datanode是HDFS的责任,它不是根据hive CLUSTERED BY键完成的!假设我有两个表,由相同的密钥组成,我通过这个密钥加入 - 可以从HDFS获得一个 ..
发布时间:2018-05-31 20:04:22 分布式计算/Hadoop

FIWARE-Cosmos的headnode的SSH访问

我遵循此指导Hadoop / FIWARE-Cosmos,我对Hive部分有疑问。 我可以访问旧集群( cosmos.lab.fiware .org )通过SSH的headnode,但是我不能为新的集群做。我尝试了 storage.cosmos.lab.fiware.org 和 computing.cosmos.lab.fiware.org 并且失败连接。 我试图通过SSH连接的意图是 ..
发布时间:2018-05-31 20:04:17 分布式计算/Hadoop

如何生成HIVE中的日期系列? (创建表)

假设我目前有一个表,每个帐户有一行,表中的数据是: 帐号 li> 开始日期 结束日期 d希望创建一个新表格,该表格每天有一行帐户处于打开状态,即每个帐户的开始日期和结束日期(含)之间的每一行为1天。 例如 表1 帐号开始日期结束日期 123 1-Jan-17 1-Jul-17 456 1-Feb-17 4-May-17 (所需表格) 账户号码日 ..
发布时间:2018-05-31 20:03:12 分布式计算/Hadoop

如果Hive失败,请停止Bash脚本

我有一个bash脚本,它可以遍历一个文件夹并处理所有* .hql文件。有时候,其中一个配置单元脚本失败(语法,资源约束等),而不是脚本失败,它将继续到下一个.hql文件。 无论如何,我可以阻止bash处理剩下​​的东西?以下是我的示例bash: 对于`ls $ {layer} / *。hql`中的i echo“Processing $ i ...” hive $ {hivecon ..
发布时间:2018-05-31 20:02:18 分布式计算/Hadoop

如何使用sqoop在Hive中创建外部表。需要建议

使用sqoop我可以创建托管表,但不能创建外部表。 请让我知道从数据仓库中卸载数据并将其加载的最佳实践Hive外部表。 1.仓库中的表是分区的。一些是明智的分区,一些是明智的分区。 请在生产环境中使用您的想法或做法。 解决方案 Sqoop不支持创建Hive外部表。相反,您可以:使用Sqoop codegen命令生成用于创建与远程RDBMS表相匹配的Hive内部表的SQL( ..
发布时间:2018-05-31 20:01:29 分布式计算/Hadoop

HIVE中的外部表格 - 从原始数据集中转义双引号

我有一个带有字符串和整型值的文件。所有的字符串都是用“”括起来的。“ int_value1,”string_value2“,int_value3,”string_value4“ 在HIVE中创建 EXTERNAL TABLE 时需要使用哪个参数所有字符串没有“? 问候 Pawel 解决方案 您可以试试这个吗?。根据您的需要将表格更改为外部。 ..
发布时间:2018-05-31 20:00:45 分布式计算/Hadoop

Hive中的CASE语句

好的,我有一个下面的代码来标记tabl中带有二进制标志的month_cd最高的记录: 选择t1。 month_cd,t2.max_month_cd ,CASE WHEN t2.max_month_cd!= null then 0 else 1 end test_1 ,CASE WHEN t2.max_month_cd = null then 0 else 1 end test_2 f ..
发布时间:2018-05-31 20:00:35 分布式计算/Hadoop

Hive Transactions正在崩溃

好的,我一直在处理这个问题几天,这让我感到非常紧张。我需要在事务中使用Hive数据库来执行'update'和'delete'操作。 我在我的机器上以伪分布模式安装了Hadoop和Hive。我已按照此教程进行安装。我使用的是Java 1.8.0_31,Hadoop 2.6.0,Hive 1.0.0,并且我还修改了一些细节,但这些细节不应该相关。 start-dfs。 sh star ..
发布时间:2018-05-31 20:00:32 Java开发