S3A文件系统上的Spark历史记录服务器:ClassNotFoundException [英] Spark History Server on S3A FileSystem: ClassNotFoundException

查看：63 发布时间：2021/4/3 19:22:44 scala apache-spark amazon-s3

本文介绍了S3A文件系统上的Spark历史记录服务器:ClassNotFoundException的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

Spark可以使用Hadoop S3A文件系统 org.apache.hadoop.fs.s3a.S3AFileSystem .通过将以下内容添加到 conf/spark-defaults.conf 中，我可以获取spark-shell来登录到S3存储桶:

Spark can use Hadoop S3A file system org.apache.hadoop.fs.s3a.S3AFileSystem. By adding the following into the conf/spark-defaults.conf, I can get spark-shell to log to the S3 bucket:

spark.jars.packages               net.java.dev.jets3t:jets3t:0.9.0,com.google.guava:guava:16.0.1,com.amazonaws:aws-java-sdk:1.7.4,org.apache.hadoop:hadoop-aws:2.7.3
spark.hadoop.fs.s3a.impl          org.apache.hadoop.fs.s3a.S3AFileSystem
spark.eventLog.enabled            true
spark.eventLog.dir                s3a://spark-logs-test/
spark.history.fs.logDirectory     s3a://spark-logs-test/
spark.history.provider            org.apache.hadoop.fs.s3a.S3AFileSystem

Spark History Server还从 conf/spark-defaults.conf 加载配置，但似乎没有加载 spark.jars.packages 配置，并抛出ClassNotFoundException :

Spark History Server also loads configuration from conf/spark-defaults.conf, but it seems not to load spark.jars.packages configuration, and throws ClassNotFoundException:

Exception in thread "main" java.lang.ClassNotFoundException: org.apache.hadoop.fs.s3a.S3AFileSystem
    at java.net.URLClassLoader.findClass(URLClassLoader.java:381)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:331)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
    at java.lang.Class.forName0(Native Method)
    at java.lang.Class.forName(Class.java:348)
    at org.apache.spark.util.Utils$.classForName(Utils.scala:225)
    at org.apache.spark.deploy.history.HistoryServer$.main(HistoryServer.scala:256)
    at org.apache.spark.deploy.history.HistoryServer.main(HistoryServer.scala)

用于加载配置的Spark源代码在

The Spark source code for loading configuration is different in SparkSubmitArguments.scala and in HistoryServerArguments.scala, in particular the HistoryServerArguments does not seem to load packages.

是否可以将 org.apache.hadoop.fs.s3a.S3AFileSystem 依赖项添加到History Server?

Is there a way to add the org.apache.hadoop.fs.s3a.S3AFileSystem dependency to the History Server?

S3A文件系统上的Spark历史记录服务器:ClassNotFoundException [英] Spark History Server on S3A FileSystem: ClassNotFoundException

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

S3A文件系统上的Spark历史记录服务器:ClassNotFoundException [英] Spark History Server on S3A FileSystem: ClassNotFoundException

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭