apache-zeppelin相关内容
从Apache Zeppelin笔记本界面启动Spark作业时,它会向您显示作业执行的进度条.但是,这一进展实际上意味着什么?有时它会缩小或扩展.是当前阶段的进展还是整个工作? 解决方案 在Web界面中,进度条显示的是getProgress函数返回的值(并非为每个交错器都实现,例如此函数返回一个百分比. 使用Spark解释器时,该值似乎是已完成任务的百分比(从progress函数)/
..
我正在按照本指南在使用minikube设置的本地kubernetes集群中运行一个齐柏林飞艇容器. https://zeppelin.apache.org/docs/0.9.0-SNAPSHOT/quickstart/kubernetes.html 我能够设置齐柏林飞艇并在其中运行一些示例代码.我已经下载了spark 2.4.5& 2.4.0源代码,并使用以下命令将其构建为支持kube
..
我尝试构建从github下载的zeppelin-0.7.0 master分支,但失败了. 构建命令: mvn package -Pyarn -Pbuild-distr -Pspark-2.0 -Dspark.version=2.0.1 -Phadoop-2.6 -Dhadoop.version=2.6.0 -Pscala-2.11 -Ppyspark -DskipTests -X
..
在齐柏林飞艇上使用火花时出现奇怪的错误.当我使用导入的类时,找不到它们.代码示例是: %spark import java.io.Serializable import java.text.{ParseException, SimpleDateFormat} import java.util.{Calendar, SimpleTimeZone} class Pos(val pos: Str
..
使用主要下载中的Zeppelin 0.7.2二进制文件和带有Hadoop 2.6的Spark 2.1.0(以下段落): val df = spark.read.parquet(DATA_URL).filter(FILTER_STRING).na.fill("") 产生以下内容: java.lang.NoSuchMethodError: com.fasterxml.jackson.m
..
我正在尝试从源代码构建Apache zeppelin.但它在“齐柏林飞艇网" 处中断,出现以下错误 [ERROR] Failed to execute goal com.github.eirslett:frontend-maven-plugin:0.0.23:bower (bower install) on project zeppelin-web: Failed to run task:
..
我正在尝试在带有pyspark的Zeppelin笔记本中使用Delta Lake,似乎无法成功导入该模块.例如 %pyspark from delta.tables import * 它失败并出现以下错误: ModuleNotFoundError:没有名为"delta"的模块 但是,使用delta格式保存/读取数据帧没有问题.如果使用scala spark %spark ,
..
在齐柏林飞艇中运行Spark二等分kmmeans算法. //I transform my data using the TF-IDF algorithm val idf = new IDF(minFreq).fit(data) val hashIDF_features = idf.transform(dbTF) //and parse the transformed data
..
我正在从Maven构建Apache Zeppelin 0.8.0,我必须使用Zeppelin提供的高级功能,例如Apache Zeppelin笔记本授权允许“跑步者" 但是我正在尝试使用不同版本的节点和npm,但是在mvn clean package -DskipTests期间仍在构建Building Zeppelin时收到以下错误:Web应用程序. 以下是调试日志中的错误日志:/root/.n
..
我正在尝试使用Spark解释器在Zeppelin 0.8.0中使用一些Scala代码: %spark import scala.beans.BeanProperty class Node(@BeanProperty val parent: Option[Node]) { } 但是似乎没有考虑进口 import scala.beans.BeanProperty :
..
在 我已经尝试过了: z.show(dfLemma.select(concat_ws(",", $"lemma"))) 但是它只是给了我一个单词列表,格式不好,我也希望在输出中添加种族主义列. 非常感谢您的帮助. 解决方案 以下是格式化数组列的建议: import org.apache.spark.sql.Column import org.apache.spark.sql
..
我有一个安装了Spark 2.0和Zeppelin 0.6.1的集群.由于TwitterUtils.scala类已从Spark项目移至Apache Bahir,因此我不能再在Zeppelin笔记本中使用TwitterUtils. 这是我的笔记本摘要: 依赖项加载: %dep z.reset z.load("org.apache.bahir:spark-streaming-twit
..
是否可以将Zeppelin笔记与git集成?可以设置存储库位置,但如何将其设置为远程git存储库. 但是,此功能在Amazon EMR上可用 解决方案 是.有可能 我使用以下方式. 创建一个github存储库并推送所有笔记本.喜欢 git clone https://github.com/rockiey/zeppelin-notebooks.git cd zeppe
..
我目前正在使用Apache Zeppelin进行一些数据可视化工作,只是很好奇为什么没有人为R提供解释器.从文档中看来,创建一个新的解释器应该不太难,但是如果真的很容易,应该已经有各种语言的口译员,所以我错了吗? 解决方案 编辑 在新的齐柏林飞艇中,集成了两个R解释器.因此,对于最新版本,我们不需要执行以下步骤. 由于未发布0.6.0,我们需要对其进行克隆和构建 R解释器
..
我使用Zeppelin中的Spark解释器在一个段落中运行一个脚本.它具有导入,导入的名称可以从全局名称空间以及函数解析,但不能从类内部的方法解析. 这在我的计算机上安装的Scala(2.12)上运行良好,但在Zeppelin(Scala 2.11)中不起作用. import java.util.Calendar def myFun: String = { // this w
..
我的配置如下: Ubuntu 15.04 Java 1.7 Spark 1.4.1 Hadoop 2.7 Maven 3.3.3 在从github成功克隆并使用以下命令后,我正在尝试安装Apache Zeppelin mvn clean package -DskipTests 尽管进行了几次尝试,但在获得一些初步成功后,我遇到了以下错误: [错误]无法执行目标 com.g
..
我正在尝试使用Zeppelin在Spark ML中构建模型. 我是这个领域的新手,需要帮助.我想我需要为该列设置正确的数据类型,并将第一列设置为标签.任何帮助将不胜感激,谢谢 val training = sc.textFile("hdfs:///ford/fordTrain.csv") val header = training.first val inferSchema = true
..
在齐柏林飞艇(Zeppelin)中,我必须在每一行提供口译员.有没有一种方法可以为整个会话设置解释器. %pyspark import re 花费0秒. import pandas as pd 控制台:1:错误:'.'预期但找到了标识符.将熊猫作为pd导入 %pyspark import pandas as pd 花费0秒. 如何为整个会话设置解释器?
..
是否可以在Zeppelin上自定义皮肤?换句话说,用其他东西代替Zeppelin徽标吗? 解决方案 是的,很有可能. 您知道Apache Zeppelin(正在孵化)是一个开源项目,因此只需: 从 github.com/apache/incubator-zeppelin 克隆它 在zeppelin-web子模块中进行修改 这是一个标准的Angular Web应用程序,
..
我正在使用HDP版本:2.6.4 您能否提供有关如何将库安装到spark2下的以下python目录的分步说明? sc.version(火花版本)返回 res0: String = 2.2.0.2.6.4.0-91 spark2解释器的名称和值如下 zeppelin.pyspark.python: /usr/local/Python-3.4.8/bin/python
..