EMR-5.32.0上的Spark未生成请求的执行器 [英] Spark on EMR-5.32.0 not spawning requested executors

查看：19 发布时间：2022/5/25 17:44:50 apache-spark pyspark configuration amazon-emr spark-submit

本文介绍了EMR-5.32.0上的Spark未生成请求的执行器的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我在EMR(版本5.32.0)上的(Py)Spark中遇到了一些问题。大约一年前，我在EMR集群上运行了相同的程序(我认为发行版一定是5.29.0)。然后，我能够使用spark-submit参数正确配置我的PySpark程序。但是，现在我正在运行相同/相似的代码，但是spark-submit参数似乎没有任何效果。

我的集群配置：

主节点：8个VCORE，32 GiB内存，仅EBS存储EBS存储：128 GiB
从节点：10 x 16 VCORE，64 GiB内存，仅EBS存储EBS存储：256 GiB

我使用以下spark-submit参数运行该程序：

spark-submit --master yarn --conf "spark.executor.cores=3" --conf "spark.executor.instances=40" --conf "spark.executor.memory=8g" --conf "spark.driver.memory=8g" --conf "spark.driver.maxResultSize=8g" --conf "spark.dynamicAllocation.enabled=false" --conf "spark.default.parallelism=480" update_from_text_context.py

我没有更改群集上的默认配置中的任何内容。

下面是Spark UI的屏幕截图，其中只显示了10个执行器，而我预计会有40个执行器可用...

我尝试了不同的spark-submit参数，以确保错误与Apache Spark: setting executor instances does not change the executors无关。我试了很多方法，但似乎都没有用。

我有点迷路了，有人能帮帮忙吗？

更新： 我在EMR版本标签5.29.0上运行了相同的代码，在那里spark-submit参数中的conf设置似乎产生了影响：

为什么会发生这种情况？

EMR-5.32.0上的Spark未生成请求的执行器 [英] Spark on EMR-5.32.0 not spawning requested executors

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

EMR-5.32.0上的Spark未生成请求的执行器 [英] Spark on EMR-5.32.0 not spawning requested executors

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭