hive相关内容

Hive是否支持选择?

插入表格webmap 选择一个.res引用,b.res资源, (从weblog中选择count(ip),其中resource = a.res和referer = b.res)从顶部权重 返回一个联接toprefres b; 我在hive-0.10.0-cdh4.5.0中运行该程序,并得到以下错误: 失败:ParseException行3:1无法识别接近'select''coun ..
发布时间:2018-05-31 20:25:04 分布式计算/Hadoop

用十六进制分隔Hive CsvSerde表

我正尝试使用由十六进制值1F分隔的csvserde创建一个外部配置单元表。 csvserde在分隔的常规逗号上正常工作。 CREATE EXTERNAL TABLE example_table( id bigint, property_id字符串, application_date日期, system_time时间戳, system_end时间戳 ) ROW FORMAT S ..
发布时间:2018-05-31 20:24:54 分布式计算/Hadoop

配置单元 - python连接错误

这是代码: $ b #!/ usr / bin / env python import pyhs2 try: with pyhs2.connect(host ='localhost',$ b $ port = 10001, authMechanism =“PLAIN”, user ='root ', password ='test', database ='test')as ..
发布时间:2018-05-31 20:24:15 Python

Hive count(*)查询不调用mapreduce

我在配置单元中有外部表,我试图从table_name 查询运行 select count(*),但是查询立即返回并给出了我认为已经存储的结果。查询返回的结果不正确。有没有办法强制map reduce作业,并且每次都要执行查询。 注意:所有外部表格都不遵循此行为,但其中一些表格不符合。 / p> 使用的版本:Hive 0.14.0.2.2.6.0-2800,Hadoop 2.6.0.2. ..
发布时间:2018-05-31 20:22:52 分布式计算/Hadoop

缺少Hive执行jar Hadoop

我知道这是一个重复问题,但这个链接在stackoverflow上没有解决我的问题。当我尝试运行Hive时,出现以下错误: Pawandeep-Singh-2:apache-hive-1.1.1-bin PawandeepSingh1 $ bin / hive readlink:非法选项 - f 用法:readlink [-n] [文件...] 缺少Hive Execu ..
发布时间:2018-05-31 20:21:56 分布式计算/Hadoop

如何获得蜂巢中给定时区的当前时间

table1包含 timelocation 2015-03-04 15:00芝加哥 2015-03-04 15:00丹佛 2015-03-04 15:00火奴鲁鲁 $ b $ p $ ID $ b $ $ b美国/芝加哥中央标准时间 美国/丹佛山地标准时间 太平洋/檀香山HAWAII-ALEUTIAN标准时间 对于表1中记录的“2015-03- ..
发布时间:2018-05-31 20:21:41 Java开发

Sqoop导出分区Hive表

试图导出分区Hive表时遇到了一些问题。这是完全支持(我试图谷歌它,并发现一个JIRA票)? sqoop导出--connect jdbc:mysql :// localhost / testdb --table sales --export-dir / user / hive / warehouse / sales --direct 以下是我得到的结果: 0000 ..
发布时间:2018-05-31 20:21:33 分布式计算/Hadoop

PHP蜂巢服务器2的问题

我想从一个php客户端连接到hiveserver2。但是,我得到一个空白页面(我应该看到蜂巢中的表格列表)。我修改了 的代码 https://github.com/garamon/php-节俭蜂房客户端。最初,我得到这个错误 TSocket:超时从主机读取4个字节。按照此处的建议 https://stackoverflow.com/a/19199938/4379550 实施修补程序之后。错误消 ..
发布时间:2018-05-31 20:21:30 PHP

Oozie工作流配置单元动作卡在RUNNING中

我从Hortonworks发行版运行Hadoop 2.4.0,Oozie 4.0.0,Hive 0.13.0。 我有多个Oozie协调器作业可以启动工作流程大约在同一时间。协调器作业每个都监视不同的目录,当_SUCCESS文件显示在这些目录中时,工作流将启动。 工作流运行Hive操作,从外部目录读取并复制东西。 SET hive.exec.dynamic.partition = ..
发布时间:2018-05-31 20:20:58 分布式计算/Hadoop

如何提高从非分区表加载数据到HIVE ORC分区表中的性能

我是Hive Querying的新手,我正在寻找从Hive表中检索数据的最佳实践。我们已经启用了TeZ的执行引擎并启用了向量化。 我们希望从Hive表格中进行报告,我从TEZ文档中读取它可以用于实时报告。场景来自我的WEB应用程序,我想在UI上显示Hive Query Select *从Hive表中的结果,但对于任何查询,在hive命令提示符下最少需要20-60秒,即使hive表有60 GB ..
发布时间:2018-05-31 20:20:34 分布式计算/Hadoop