livy相关内容

超时错误:带有 400 状态代码的错误:“要求失败:会话未处于活动状态".

我正在使用 Zeppelin v0.7.3 笔记本来运行 Pyspark 脚本.在一个段落中,我正在运行脚本以将数据从 dataframe 写入 Blob 文件夹中的 parquet 文件.文件按国家/地区进行分区.数据帧的行数为 99,452,829.当脚本到达1小时时,遇到错误—— 400 状态码错误:“要求失败:会话不是活跃. 我的笔记本默认解释器是 jdbc.我已经阅读了 ti ..
发布时间:2021-11-14 23:53:40 Python

Zeppelin 0.7.2 版本不支持 spark 2.2.0

如何降级spark版本?其他解决方案是什么?我必须使用 spark 会话将我的配置单元表连接到 spark.但是 zeppelin 不支持 spark 版本. 解决方案 这里有两个原因. [1] Zeppelin 0.7.2 将 spark 2.2+ 标记为不受支持的版本. https://github.com/apache/zeppelin/blob/v0.7.2/spark ..
发布时间:2021-11-14 23:52:32 其他开发

通过http运行livy作业,而无需每次都上传jar

我正在玩Livy/Spark,对如何使用其中的一些东西有些困惑.在livy examples文件夹中有一个示例,该示例中的建筑作业已上传到Spark.我喜欢正在使用的接口,但是我想通过http接口到livy/spark,因为我没有Java客户端.这样看来,如果我使用livyclient上传jar,它仅存在于该spark会话中.有没有一种方法可以将livyjobs上传到spark,然后在所有spar ..
发布时间:2021-04-08 20:03:08 Java开发

如何将Livy curl调用转换为Livy Rest API调用

我开始使用Livy,在我的设置中,Livy服务器在Unix机器上运行,我可以对它进行卷曲并执行作业.我创建了一个胖子罐并将其上传到hdfs,我只是从Livy调用了它的主要方法.我的用于Livy的Json有效负载如下所示: { "file" : "hdfs:///user/data/restcheck/spark_job_2.11-3.0.0-RC1- SNAPSHOT.jar", "prox ..
发布时间:2020-06-29 20:56:06 其他开发

超时错误:400 StatusCode错误:“请求失败:会话未激活."

我正在使用Zeppelin v0.7.3笔记本运行Pyspark脚本.在一个段落中,我正在运行脚本以将数据从dataframe写入Blob文件夹中的parquet文件.文件按国家/地区分区.数据帧的行数为99,452,829.脚本到达1 hour时,遇到错误- 400 StatusCode错误:“要求失败:会话未完成 活跃. 我的笔记本电脑默认解释器是jdbc.我已阅读有关timeou ..
发布时间:2020-06-29 20:56:04 Python

使用curl在svy上提交spark Jobs

我正在通过Curl提交一次Livy(0.6.0)会话中的Spark作业 作业是一个很大的jar文件,完全扩展了Job接口,如下所示: https://stackoverflow.com/a/49220879/8557851 实际上,使用以下curl命令运行此代码时: curl -X POST -d '{"kind": "spark","files":["/config.json" ..
发布时间:2020-06-29 20:55:49 其他开发

在POST/批次请求中使用现有的SparkSession

我正在尝试使用Livy远程提交几个Spark 职位.可以说我想远程执行 spark-submit任务(使用所有选项) spark-submit \ --class com.company.drivers.JumboBatchPipelineDriver \ --conf spark.driver.cores=1 \ --conf spark.driver.memory=1g \ --conf ..
发布时间:2020-06-29 20:55:46 其他开发

如何使用AirFlow提取使用Apache Livy批处理POST方法提交的Spark作业客户端日志

我正在使用Apache Livy批处理POST方法提交Spark作业。 此HTTP请求是使用AirFlow发送的。提交作业后,我正在使用批处理ID跟踪状态。 Livy /资源管理器。 使用Apache Livy REST API可以做到吗? 解决方案 Livy有一个端点来获取日志 / sessions / {sessionId} / log & / batches / {bat ..
发布时间:2020-06-02 21:37:06 其他开发

通过在Livy上提交批POST方法并跟踪作业来使用Airflow触发作业提交

我想使用Airflow来编排工作,包括运行一些猪脚本,shell脚本和Spark作业。 主要用于Spark作业,我想使用Apache Livy但不确定是否使用或运行spark-submit是个好主意。 即使我提交了使用Airflow跟踪Spark作业的最佳方法是什么? > 解决方案 我假设您是包含 Java的应用程序 JAR / Scala 您要提交到远程 Spark 集群的代 ..
发布时间:2020-06-02 21:30:29 其他开发

Zeppelin 0.7.2版本不支持spark 2.2.0

如何降级spark版本?什么可能是其他解决方案?我必须使用spark会话连接我的配置单元表来激发。但是zeppelin不支持spark版本。 解决方案 这里有两个原因。 Zeppelin 0.7.2将spark 2.2+标记为不支持的版本。 https://github.com/apache/zeppelin/blob/v0.7.2/spark/src/main/java/or ..
发布时间:2018-06-12 14:08:15 其他开发