cloudera相关内容

在core-site.xml中设置fs.default.name将HDFS设置为Safemode

我在一台机器上以伪分布模式安装了Cloudera CDH4发行版,并成功测试了它的工作正常(例如,可以运行MapReduce程序,在Hive服务器上插入数据等)。但是,如果我有机会 core-site.xml 文件将 fs.default.name 设置为机器名称而不是 localhost 并重新启动NameNode服务,HDFS进入安全模式。 在更改 fs.default之前。名称,我运行 ..
发布时间:2018-05-31 18:43:41 分布式计算/Hadoop

搜索存储在Hadoop中的文档 - 使用哪个工具?

我迷失在:Hadoop,Hbase,Lucene,Carrot2,Cloudera,Tika,ZooKeeper,Solr,Katta,Cascading,POI ... 当你阅读关于你可以经常确定其他工具将被提及的那个。 我不指望你向我解释每一个工具 - 当然不是。如果你能帮我缩小这个特定场景的话,那就太好了。到目前为止,我不确定上述哪一种方法是合适的,它看起来像(一如既往)那里有更 ..
发布时间:2018-05-31 18:43:35 分布式计算/Hadoop

hadoop - map减少任务和静态变量

我刚开始研究一些hadoop / hbase MapReduce作业(使用cloudera),并且我有以下问题: 比方说,我们有一个java类,主要和一个静态变量。该类定义了与Mapper和Reducer任务相对应的内部类。 在开始工作之前,主要初始化静态变量。该变量在Mapper类中读取。然后使用群集上的'hadoop jar'启动该类。 我的问题:我没有看到其他节点上的Map和R ..
发布时间:2018-05-31 18:38:06 Java开发

使用Pig ERROR 2998的CDH4 Hbase java.lang.NoClassDefFoundError:org / apache / hadoop / hbase / filter / Filter

我在伪分布式模式下使用CDH4,并且与HBase和Pig一起工作时遇到了一些麻烦(但两者都可以正常工作)。 我正在关注一步一步这个很好的教程: http://blog.whitepages。因此,我的猪脚本看起来像这样 $ b $ / $ / $> b 注册/usr/lib/zookeeper/zookeeper-3.4.3-cdh4.1.2.jar 注册/ usr / lib / ..

每周从FTP下载文件到HDFS

我想将每周从ftp服务器上下载的文件自动化到CDH5 hadoop群集中。最好的办法是什么? 我正在考虑一个Oozie协调员的工作,但我想不出一个好的方法来下载文件。 解决方案 由于您使用CDH5,值得注意的是 NFSv3 与HDFS的接口包含在该Hadoop发行版中。您应该检查“ CDH5安装指南“文档中的”配置NFSv3网关“。 一旦完成,您可以使用wget,curl,py ..
发布时间:2018-04-13 13:56:20 其他开发

Docker容器中的Hadoop是否更快/值得吗?

我有一个 Hadoop 的环境。我在这个系统中使用 Flume , Hue 和 Cassandra 现在有一个围绕 Docker 的大炒作,所以想在这种情况下检查码头化的优缺点。我认为它应该更加便携,但可以使用 Cloudera Manager 点击几下设置。它可能更快还是为什么值得吗?有什么优点? 也许应该只有多个节点 Cassandra cluster dockerized? 解决方案 ..
发布时间:2017-06-10 23:10:55 Linux/Unix

具有Docker的多节点Hadoop集群

我正在基于 Docker 的环境中的多节点 Hadoop 集群的计划阶段。所以它应该是基于一个轻量级易于使用的虚拟化系统。 当前架构(关于文档)包含1个主节点和3个从节点。该主机使用 HDFS 文件系统和 KVM 进行虚拟化。 整个云由 Cloudera Manager 管理。在这个集群上安装了几个Hadoop模块。还有一个 NodeJS 数据上传服务。 这一次,我应该建立一个基于Docke ..
发布时间:2017-06-10 22:44:15 Linux/Unix

Oozie + Sqoop:JDBC Driver Jar位置

我有一个6节点cloudera的hadoop集群,我试图从oozie的一个sqoop动作连接到一个oracle数据库。 我已经复制了我的ojdbc6 .jar到所有节点的sqoop lib位置(对我来说恰好是在/opt/cloudera/parcels/CDH-4.2.0-1.cdh4.2.0.p0.10/lib/sqoop/lib/)并验证我可以从所有6个节点运行一个简单的“sqoop e ..
发布时间:2017-05-02 22:15:26 其他开发

Hadoop distcp在两个安全(kerberos)群集之间

我有两个Hadoop集群,两个都运行相同的Hadoop版本。我还在两个集群中都有一个用户“testuser”(示例)(因此testuser keytabs同时存在)。 Namenode# 1(源群集):hdfs:// nn1:8020 Namenode#2(目标群集):hdfs:// nn2:8020 我想使用hadoop distcp将一些文件从一个集群复制到另一个集群 ..
发布时间:2016-12-02 18:25:15 云存储

Cloudera Manager无法添加主机

我已按照这里的步骤进行安装程序当我到达检查角色分配阶段时,我只看到一个托管主机: localhost.localdomain 。 任何后续尝试添加其他主机的结果相同: 每个群集主机安装成功 且主机不显示为托管 我缺少什么? 更新:我不想回答我自己的问题,所以我在这里写我的回答。 解决方案是如此明显,我的云没有看到它,并留下了问题未解决了一段时间,直到它打我,当做一些 ..
发布时间:2016-12-02 18:11:25 云存储

虚拟机“Cloudera快速启动”不启动

我最近在 http://www.cloudera.com 下载了“QuickStart VM” (正确的是virtualbox的版本) 这个虚拟机使用centOS(和我的电脑是一个macbook空气) 我不能完全启动这个虚拟机(我不知道为什么) 我附上了最高级引导状态的屏幕截图 解决方案 有类似的问题。修正: 下载cloudera-quickstart-vm封存。 li> ..
发布时间:2016-11-14 11:26:27 Linux/Unix

加载rJava时出错

当我想加载rJava时出现错误。 JDK已安装。 (我在CentOS VM上运行R(cloudera demo vm cdh3u4)) >库(rJava) 错误:.onLoad在loadNamespace()中为'rJava'失败,详细信息: call:dyn.load(file,DLLpath = DLLpath,...) 错误:无法加载共享对象'/home/cloudera/R/x ..
发布时间:2016-11-14 10:39:56 Java开发