hadoop-yarn相关内容

Spark 作为另一个用户提交到纱线

是否可以将一个 spark 作业提交到一个纱线集群并选择,无论是使用命令行还是在 jar 中,哪个用户将“拥有"该作业? spark-submit 将从包含用户的脚本启动. PS:如果集群具有 kerberos 配置(并且脚本是密钥表),是否还有可能? 解决方案 对于非 kerberized 集群:export HADOOP_USER_NAME=zorro 在提交 Spark ..
发布时间:2021-12-15 19:15:25 其他开发

MapReduce 作业挂起,等待分配 AM 容器

我尝试将简单的字数统计作为 MapReduce 作业运行.在本地运行时一切正常(所有工作都在名称节点上完成).但是,当我尝试使用 YARN(将 mapreduce.framework.name=yarn 添加到 mapred-site.conf)在集群上运行它时,作业挂起. 我在这里遇到了类似的问题:MapReduce 作业卡在接受状态 作业输出: *** 开始 ***15/12/2 ..
发布时间:2021-12-15 19:11:48 其他开发

YARN Resourcemanager 未连接到节点管理器

在此先感谢您的帮助 我正在运行以下版本: Hadoop 2.2动物园管理员 3.4.5Hbase 0.96蜂巢0.12 当我访问 http://:50070 时,我能够正确地看到 2 个节点正在运行. 问题是当我访问 http://:8088 时,它显示 0 个节点正在运行. 我知道 :8088 反映了资源管理器并显示了运行的节点管理器的数量.守护进程都启动了,但节点 ..
发布时间:2021-12-15 19:10:33 其他开发

如何在yarn客户端模式下在远程主节点上提交spark作业?

我需要将 Spark 应用程序/作业提交到远程 Spark 集群.我目前在我的机器上有火花,主节点的 IP 地址作为纱线客户端.顺便说一句,我的机器不在集群中.我用这个命令提交我的工作 ./spark-submit --class SparkTest --deploy-mode 客户端/home/vm/app.jar 我将我的主人的地址硬编码到我的应用程序中 val spark_master ..
发布时间:2021-12-15 19:10:12 其他开发

如何保留 YARN 的日志文件?

突然,我的 YARN 集群停止工作,我提交的所有内容都失败并显示“退出代码 1".我想追踪这个问题,但是一旦应用程序失败,YARN 就会删除日志文件.我必须为 YARN 调整哪些配置设置才能保留这些日志文件? 解决方案 您的容器似乎正在退出,退出代码为 1. 您无法在 UI 上看到日志,因为默认情况下,日志聚合处于禁用状态.以下参数确定日志聚合:“yarn.log-aggregati ..
发布时间:2021-12-15 19:09:52 其他开发

Hadoop:连接到 ResourceManager 失败

在安装 hadoop 2.2 并尝试启动管道示例后,我得到了以下错误(尝试启动后出现相同的错误 hadoop jar hadoop-mapreduce-examples-2.2.0.jar wordcount someFile.txt/out): /usr/local/hadoop$ hadoop 管道 -Dhadoop.pipes.java.recordreader=true -Dhadoop ..
发布时间:2021-12-15 19:08:04 其他开发

YARN 中的容器是什么?

YARN 中的容器是什么?与nodemanager上的任务运行的子JVM相同还是不同? 解决方案 它代表给定集群中单个节点上的资源(内存). 一个容器是 由节点管理器监督 由资源经理安排 一个 MR 任务在这样的容器中运行. ..
发布时间:2021-12-15 19:04:06 其他开发

即使 Hadoop 正在运行,它也没有在作业跟踪器中显示我的作业

问题:当我向我的 hadoop 2.2.0 集群提交作业时,它没有显示在作业跟踪器中但作业成功完成.可以看到输出并且它正在正确运行并在运行时打印输出. 我尝试了多个选项,但作业跟踪器没有看到作业.如果我使用 2.2.0 hadoop 运行流式作业,它会显示在任务跟踪器中,但是当我通过 hadoop-client api 提交它时,它不会显示在作业跟踪器中.我正在查看 8088 端口上的 ui ..
发布时间:2021-12-15 18:56:54 Java开发

Spark Shell - __spark_libs__.zip 不存在

我是 Spark 的新手,我正在忙着设置启用 HA 的 Spark 集群. 当通过以下方式启动 spark shell 进行测试时:bash spark-shell --master yarn --deploy-mode client 我收到以下错误(请参阅下面的完整错误):file:/tmp/spark-126d2844-5b37-461b-98a4-3f3de5ece91b/__s ..
发布时间:2021-12-15 18:55:39 其他开发

Hadoop 在哪里存储 YARN 应用程序的日志?

我运行了 Hortonworks 的纱线应用程序示例的基本示例.应用程序失败,我想阅读日志以找出原因.但是我在存储我的 mapreduce 作业日志的预期位置 (/HADOOP_INSTALL_FOLDER/logs) 找不到任何文件. 有人知道yarn在哪里存储非mapreduce日志文件吗?我必须在 xml 文件中配置一个特殊目录吗? 解决方案 容器日志应该在 yarn.node ..
发布时间:2021-12-15 18:40:44 其他开发

容器运行超出内存限制

在 Hadoop v1 中,我分配了每个 7 个映射器和减速器插槽,大小为 1GB,我的映射器和减速机运行良好.我的机器有8G内存,8个处理器.现在使用 YARN,在同一台机器上运行相同的应用程序时,出现容器错误.默认情况下,我有以下设置: yarn.scheduler.minimum-allocation-mb1024ya ..
发布时间:2021-12-15 18:18:36 其他开发