分布式计算/Hadoop

Hive count(*)查询不调用mapreduce

我在配置单元中有外部表,我试图从table_name 查询运行 select count(*),但是查询立即返回并给出了我认为已经存储的结果。查询返回的结果不正确。有没有办法强制map reduce作业,并且每次都要执行查询。 注意:所有外部表格都不遵循此行为,但其中一些表格不符合。 / p> 使用的版本:Hive 0.14.0.2.2.6.0-2800,Hadoop 2.6.0.2. ..
发布时间:2018-05-31 20:22:52 分布式计算/Hadoop

Hadoop UI只显示一个Datanode

配置似乎很好: hduser @ ubuntu-amd64:/ usr / local / hadoop $ ./bin/hdfs dfsadmin -report 当我输入NameNode UI( http://10.20.0.140:50070/ )概述卡看起来没问题 - 例如,所有节点的总容量可能会增加。 问题是,在卡 Datanodes 中只能看到一个datanode。 ..
发布时间:2018-05-31 20:22:50 分布式计算/Hadoop

Hadoop MapReduce(Yarn)使用具有不同功率/规格的主机

我目前在群集中拥有高功率(cpu / ram)主机,我们正在考虑添加一些优质存储,但是低功耗主机。 我担心的是会降低工作表现。来自新的(较弱的)主机的Map / Reducers将运行得更慢,而更强大的主机将只需等待结果。 有没有办法配置这个在纱线?也许可以为主机设置优先级,或根据每台机器上的内核数量来分配映射器/缩减器。 谢谢, Horatiu 解决方案 在YARN中 ..
发布时间:2018-05-31 20:22:00 分布式计算/Hadoop

缺少Hive执行jar Hadoop

我知道这是一个重复问题,但这个链接在stackoverflow上没有解决我的问题。当我尝试运行Hive时,出现以下错误: Pawandeep-Singh-2:apache-hive-1.1.1-bin PawandeepSingh1 $ bin / hive readlink:非法选项 - f 用法:readlink [-n] [文件...] 缺少Hive Execu ..
发布时间:2018-05-31 20:21:56 分布式计算/Hadoop

hadoop fs -mkdir在连接异常时失败

$ b bin / hadoop fs - mkdir输入 我得到 mkdir :呼叫从h1 / 192.168.1.13到h1:9000连接失败异常:java.net.ConnectException:连接被拒绝;欲了解更多详情,请参阅: http://wiki.apache.org/hadoop/ConnectionRefused 这里是详细信息 core-sit ..
发布时间:2018-05-31 20:21:44 分布式计算/Hadoop

Sqoop导出分区Hive表

试图导出分区Hive表时遇到了一些问题。这是完全支持(我试图谷歌它,并发现一个JIRA票)? sqoop导出--connect jdbc:mysql :// localhost / testdb --table sales --export-dir / user / hive / warehouse / sales --direct 以下是我得到的结果: 0000 ..
发布时间:2018-05-31 20:21:33 分布式计算/Hadoop

Hadoop之上的Servlet容器?

我处于大型项目的架构阶段,我决定使用hbase作为我的数据库,并且将使用map / reduce作业进行处理,因此我的架构完全可以在hadoop下运行。 事情是我还需要实现一些REST,SOAP API的一些网页,所以我在想有没有任何servlet容器在hadoop之上运行,这样我的系统保持冗余和分布而不用担心次级集群machenism(因为我已经为hadoop设置了一个)。 那么是否 ..
发布时间:2018-05-31 20:21:19 分布式计算/Hadoop

使用Hadoop 2.6.0在Windows上运行wordcount Hadoop示例

我是Hadoop的新手,并了解到使用2.x版本,我可以在本地Windows 7 64位机器上试用Hadoop。 我安装了hadoop 2.6.0并安装了cygwin。 > 我可以执行bin / hadoop版本,但执行jar命令时出现以下错误: 注意:我还将winutils.jar放入bin中,从hadoop-common- 2.2.0.jar。 请帮忙。我无法摆脱这个错误。我还输 ..
发布时间:2018-05-31 20:21:01 分布式计算/Hadoop

Oozie工作流配置单元动作卡在RUNNING中

我从Hortonworks发行版运行Hadoop 2.4.0,Oozie 4.0.0,Hive 0.13.0。 我有多个Oozie协调器作业可以启动工作流程大约在同一时间。协调器作业每个都监视不同的目录,当_SUCCESS文件显示在这些目录中时,工作流将启动。 工作流运行Hive操作,从外部目录读取并复制东西。 SET hive.exec.dynamic.partition = ..
发布时间:2018-05-31 20:20:58 分布式计算/Hadoop

应继承scala类型不匹配错误

我一直在努力让我的机器上运行hadoop / scala桥梁,当我设置这个工作时,我从编译器中得到以下错误。 [error] found:java.lang.Class [org.apache.hadoop.mapred.TextInputFormat(classOf [org.apache.hadoop.mapred.TextInputFormat]) [error] required:j ..
发布时间:2018-05-31 20:20:46 分布式计算/Hadoop