apache-zeppelin 第8页 - IT屋-程序员软件开发技术分享社区

Apache Zeppelin如何计算Spark作业进度条?

从Apache Zeppelin笔记本界面启动Spark作业时，它会向您显示作业执行的进度条.但是，这一进展实际上意味着什么?有时它会缩小或扩展.是当前阶段的进展还是整个工作? 解决方案在Web界面中，进度条显示的是getProgress函数返回的值(并非为每个交错器都实现，例如此函数返回一个百分比. 使用Spark解释器时，该值似乎是已完成任务的百分比(从progress函数)/ ..

发布时间：2020-09-04 23:34:44 apache-spark apache-zeppelin 其他开发

用齐柏林飞艇在Kubernetes上火花

我正在按照本指南在使用minikube设置的本地kubernetes集群中运行一个齐柏林飞艇容器. https://zeppelin.apache.org/docs/0.9.0-SNAPSHOT/quickstart/kubernetes.html 我能够设置齐柏林飞艇并在其中运行一些示例代码.我已经下载了spark 2.4.5& 2.4.0源代码，并使用以下命令将其构建为支持kube ..

发布时间：2020-09-04 23:34:39 apache-spark kubernetes apache-zeppelin 其他开发

用spark 2.0构建zeppelin-0.7.0 master分支失败，并出现'yarn install --no-lockfile'失败

我尝试构建从github下载的zeppelin-0.7.0 master分支，但失败了. 构建命令: mvn package -Pyarn -Pbuild-distr -Pspark-2.0 -Dspark.version=2.0.1 -Phadoop-2.6 -Dhadoop.version=2.6.0 -Pscala-2.11 -Ppyspark -DskipTests -X ..

发布时间：2020-09-04 23:34:33 build apache-zeppelin 其他开发

使用时找不到齐柏林飞艇导入的类

在齐柏林飞艇上使用火花时出现奇怪的错误.当我使用导入的类时，找不到它们.代码示例是: %spark import java.io.Serializable import java.text.{ParseException, SimpleDateFormat} import java.util.{Calendar, SimpleTimeZone} class Pos(val pos: Str ..

发布时间：2020-09-04 23:34:08 apache-zeppelin 其他开发

Zeppelin + Spark:从S3读取Parquet会引发NoSuchMethodError:com.fasterxml.jackson

使用主要下载中的Zeppelin 0.7.2二进制文件和带有Hadoop 2.6的Spark 2.1.0(以下段落): val df = spark.read.parquet(DATA_URL).filter(FILTER_STRING).na.fill("") 产生以下内容: java.lang.NoSuchMethodError: com.fasterxml.jackson.m ..

发布时间：2020-09-04 23:34:03 apache-spark apache-zeppelin 其他开发

无法运行任务:'bower --allow-root install'失败

我正在尝试从源代码构建Apache zeppelin.但它在“齐柏林飞艇网" 处中断，出现以下错误 [ERROR] Failed to execute goal com.github.eirslett:frontend-maven-plugin:0.0.23:bower (bower install) on project zeppelin-web: Failed to run task: ..

发布时间：2020-09-04 23:33:59 maven bower bower-install apache-zeppelin 其他开发

如何在Zeppelin笔记本电脑和pyspark中导入Delta Lake模块?

我正在尝试在带有pyspark的Zeppelin笔记本中使用Delta Lake，似乎无法成功导入该模块.例如 %pyspark from delta.tables import * 它失败并出现以下错误: ModuleNotFoundError:没有名为"delta"的模块但是，使用delta格式保存/读取数据帧没有问题.如果使用scala spark %spark ， ..

发布时间：2020-09-04 23:33:57 pyspark apache-zeppelin delta-lake 其他开发

Spark抛出java.util.NoSuchElementException:找不到键:67

在齐柏林飞艇中运行Spark二等分kmmeans算法. //I transform my data using the TF-IDF algorithm val idf = new IDF(minFreq).fit(data) val hashIDF_features = idf.transform(dbTF) //and parse the transformed data ..

发布时间：2020-09-04 23:32:51 scala apache-spark apache-zeppelin nosuchelementexception 其他开发

Apache Zeppelin 0.8.0-Snapshot“无法执行build:dist" (构建Zeppelin:Web应用程序)

我正在从Maven构建Apache Zeppelin 0.8.0，我必须使用Zeppelin提供的高级功能，例如Apache Zeppelin笔记本授权允许“跑步者" 但是我正在尝试使用不同版本的节点和npm，但是在mvn clean package -DskipTests期间仍在构建Building Zeppelin时收到以下错误:Web应用程序. 以下是调试日志中的错误日志:/root/.n ..

发布时间：2020-09-04 23:32:42 apache-zeppelin 其他开发

带有Spark解释器的Zeppelin会忽略在类/函数定义之外声明的导入

我正在尝试使用Spark解释器在Zeppelin 0.8.0中使用一些Scala代码: %spark import scala.beans.BeanProperty class Node(@BeanProperty val parent: Option[Node]) { } 但是似乎没有考虑进口 import scala.beans.BeanProperty : ..

发布时间：2020-09-04 23:31:39 scala apache-spark import apache-zeppelin 其他开发

如何在Zeppelin/Spark/Scala中漂亮地打印包装好的数组?

在我已经尝试过了: z.show(dfLemma.select(concat_ws(",", $"lemma"))) 但是它只是给了我一个单词列表，格式不好，我也希望在输出中添加种族主义列. 非常感谢您的帮助. 解决方案以下是格式化数组列的建议: import org.apache.spark.sql.Column import org.apache.spark.sql ..

发布时间：2020-09-04 23:30:29 scala apache-spark apache-zeppelin 其他开发

Apache Zeppelin 0.6.1:运行Spark 2.0 Twitter Stream App

我有一个安装了Spark 2.0和Zeppelin 0.6.1的集群.由于TwitterUtils.scala类已从Spark项目移至Apache Bahir，因此我不能再在Zeppelin笔记本中使用TwitterUtils. 这是我的笔记本摘要: 依赖项加载: %dep z.reset z.load("org.apache.bahir:spark-streaming-twit ..

发布时间：2020-09-04 23:25:06 scala apache-spark spark-streaming twitter4j apache-zeppelin 其他开发

是否可以将Zeppelin笔记与git集成?

是否可以将Zeppelin笔记与git集成?可以设置存储库位置，但如何将其设置为远程git存储库. 但是，此功能在Amazon EMR上可用解决方案是.有可能我使用以下方式. 创建一个github存储库并推送所有笔记本.喜欢 git clone https://github.com/rockiey/zeppelin-notebooks.git cd zeppe ..

发布时间：2020-09-04 23:25:03 apache-zeppelin 其他开发

有人试图将R解释器添加到Apache Zeppelin上吗?

我目前正在使用Apache Zeppelin进行一些数据可视化工作，只是很好奇为什么没有人为R提供解释器.从文档中看来，创建一个新的解释器应该不太难，但是如果真的很容易，应该已经有各种语言的口译员，所以我错了吗? 解决方案编辑在新的齐柏林飞艇中，集成了两个R解释器.因此，对于最新版本，我们不需要执行以下步骤. 由于未发布0.6.0，我们需要对其进行克隆和构建 R解释器 ..

发布时间：2020-09-04 23:23:55 apache-zeppelin 其他开发

如何在Scala中解析导入的名称? (火花/齐柏林飞艇)

我使用Zeppelin中的Spark解释器在一个段落中运行一个脚本.它具有导入，导入的名称可以从全局名称空间以及函数解析，但不能从类内部的方法解析. 这在我的计算机上安装的Scala(2.12)上运行良好，但在Zeppelin(Scala 2.11)中不起作用. import java.util.Calendar def myFun: String = { // this w ..

发布时间：2020-09-04 23:18:16 scala apache-spark apache-zeppelin 其他开发

Apache Zeppelin安装grunt构建错误

我的配置如下: Ubuntu 15.04 Java 1.7 Spark 1.4.1 Hadoop 2.7 Maven 3.3.3 在从github成功克隆并使用以下命令后，我正在尝试安装Apache Zeppelin mvn clean package -DskipTests 尽管进行了几次尝试，但在获得一些初步成功后，我遇到了以下错误: [错误]无法执行目标 com.g ..

发布时间：2020-09-04 23:17:10 apache-zeppelin 其他开发

字段“功能"不存在.火花ML

我正在尝试使用Zeppelin在Spark ML中构建模型. 我是这个领域的新手，需要帮助.我想我需要为该列设置正确的数据类型，并将第一列设置为标签.任何帮助将不胜感激，谢谢 val training = sc.textFile("hdfs:///ford/fordTrain.csv") val header = training.first val inferSchema = true ..

发布时间：2020-09-04 23:17:05 scala apache-zeppelin apache-spark-ml 其他开发

Apache Zeppelin-设置默认解释器

在齐柏林飞艇(Zeppelin)中，我必须在每一行提供口译员.有没有一种方法可以为整个会话设置解释器. %pyspark import re 花费0秒. import pandas as pd 控制台:1:错误:'.'预期但找到了标识符.将熊猫作为pd导入 %pyspark import pandas as pd 花费0秒. 如何为整个会话设置解释器? ..

发布时间：2020-09-04 23:17:00 apache-zeppelin 其他开发

是否可以在Zeppelin上自定义皮肤?

是否可以在Zeppelin上自定义皮肤?换句话说，用其他东西代替Zeppelin徽标吗? 解决方案是的，很有可能. 您知道Apache Zeppelin(正在孵化)是一个开源项目，因此只需: 从 github.com/apache/incubator-zeppelin 克隆它在zeppelin-web子模块中进行修改这是一个标准的Angular Web应用程序， ..

发布时间：2020-09-04 23:16:58 apache-zeppelin 其他开发

如何在HDP的zeppelin-spark2中将库安装到python

我正在使用HDP版本:2.6.4 您能否提供有关如何将库安装到spark2下的以下python目录的分步说明? sc.version(火花版本)返回 res0: String = 2.2.0.2.6.4.0-91 spark2解释器的名称和值如下 zeppelin.pyspark.python: /usr/local/Python-3.4.8/bin/python ..

发布时间：2020-09-04 23:15:47 python pyspark hortonworks-data-platform apache-zeppelin Python

apache-zeppelin相关内容