apache-spark-1.6相关内容

如何通过 Spark 属性(Spark 1.6)在 spark-shell 中启用或禁用 Hive 支持?

是否有任何配置属性我们可以设置它以在 spark 1.6 中通过 spark-shell 明确禁用/启用 Hive 支持.我试图获取所有 sqlContext 配置属性, sqlContext.getAllConfs.foreach(println) 但是,我不确定禁用/启用配置单元支持实际上需要哪些属性.或者有没有其他方法可以做到这一点? 解决方案 火花 >= 2.0 可以 ..
发布时间:2021-11-14 22:25:35 其他开发

Spark CrossValidatorModel 访问其他模型而不是 bestModel?

我使用的是 Spark 1.6.1: 目前我正在使用 CrossValidator 用各种参数训练我的 ML 管道.在训练过程之后,我可以使用 CrossValidatorModel 的 bestModel 属性来获取在交叉验证期间表现最佳的模型.交叉验证的其他模型是否会自动丢弃,或者我可以选择性能比 bestModel 差的模型吗? 我之所以这么问是因为我使用 F1 分数指标进行交叉 ..

Spark Streaming 应用程序因 KafkaException:字符串超过最大大小或 IllegalArgumentException 而失败

TL;博士: 我非常简单的 Spark Streaming 应用程序在驱动程序中失败,并显示“KafkaException:字符串超出最大大小".我在执行程序中看到了相同的异常,但我也在执行程序日志的某个地方发现了一个 IllegalArgumentException,其中没有其他信息 完整问题: 我正在使用 Spark Streaming 从 Kafka 主题中读取一些消息.这 ..

在Spark 1.6的哪里可以找到jars文件夹?

在 Spark下载页面中,如果我下载如果我下载的是v1.6.2的 tar文件,相反,我在那儿找不到jars文件夹.我应该在该网站上使用其他包装类型吗?我目前正在选择默认值(为Hadoop 2.6预先构建).或者,在哪里可以找到这些Spark罐-我应该分别从 http://spark-packages.org ? 以下是我要使用的一堆指示罐: hadoop-common 火花芯 sp ..
发布时间:2021-02-09 20:45:55 其他开发

Spark流的动态分配

我有一个Spark Streaming作业与其他作业(Spark核心作业)一起在我们的集群上运行。我想对包括Spark Streaming在内的这些作业使用动态资源分配。根据下面的JIRA问题,动态分配不支持Spark Streaming(在1.6.1版本中)。但是已在2.0.0中修复 JIRA链接 PDF在本期中,它说应该有一个名为 spark.streaming.dynamicA ..

为什么在Spark Shell中导入SparkSession失败,并显示“对象SparkSession不是软件包org.apache.spark.sql的成员”?

我在VM,Cloudera计算机上使用Spark 1.6.0。 我正在尝试从Spark外壳向Hive表中输入一些数据。 为此,我正在尝试使用SparkSession。但是下面的导入无效。 scala> import org.apache.spark.sql.SparkSession :33:错误:对象SparkSession不是包org.apache.spar ..
发布时间:2020-10-03 00:28:38 其他开发

Spark Streaming应用程序失败,出现KafkaException:字符串超出最大大小或IllegalArgumentException

TL; DR: 我非常简单的Spark Streaming应用程序在驱动程序中失败,并显示“ KafkaException:字符串超出最大大小”。我在执行程序中看到了相同的异常,但是我还在执行程序的日志中的某个地方发现了一个IllegalArgumentException,其中没有其他信息 完整问题: 我正在使用Spark Streaming从Kafka主题中读取一些消息。 这 ..

如何通过Spark属性(Spark 1.6)在spark-shell中启用或禁用Hive支持?

是否有任何配置属性,我们可以将其设置为通过spark 1.6中的spark-shell显式禁用/启用Hive支持.我试图使用所有的sqlContext配置属性, sqlContext.getAllConfs.foreach(println) 但是,我不确定禁用/启用配置单元支持实际上需要哪个属性.还是有其他方法可以做到这一点? 解决方案 火花> = 2.0 通过配置可以 ..
发布时间:2020-09-04 08:13:41 其他开发

为什么由于连接被拒绝,YARN上的Spark应用程序失败并显示FetchFailedException?

我正在使用spark version 1.6.3,而yarn version 2.7.1.2.3随HDP-2.3.0.0-2557一起提供.因为,在我使用的HDP版本中,spark版本太旧了,我宁愿远程使用另一个spark作为纱线模式. 这是我运行spark shell的方式; ./spark-shell --master yarn-client 一切似乎都很好,sparkCont ..
发布时间:2020-09-04 06:08:34 其他开发

PySpark序列化EOFError

我正在读取CSV作为Spark DataFrame,并对其执行机器学习操作.我不断收到Python序列化EOFError-为什么知道?我认为这可能是内存问题-即文件超出了可用RAM-但大幅度减小DataFrame的大小并不能防止EOF错误. 下面的玩具代码和错误. #set spark context conf = SparkConf().setMaster("local").setA ..
发布时间:2020-09-04 03:10:45 Python