apache-zeppelin相关内容
我是齐柏林飞艇的新手.我有一个用例,其中有一个熊猫数据框.我需要使用齐柏林飞艇的内置图表来可视化集合,我这里没有一个明确的方法.我对齐柏林飞艇的理解是,如果它是RDD格式,我们可以可视化数据.所以,我想将pandas数据框转换为spark数据框,然后进行一些查询(使用sql),我将进行可视化. 首先,我尝试将pandas数据框转换为spark,但是我失败了 %pyspark import p
..
我有一个pyspark数据框,我正在尝试使用toPandas()将其转换为熊猫,但是我遇到了以下提到的错误. 我尝试了不同的选项,但遇到了相同的错误: 1)将数据限制为只有几条记录 2)显式使用了collect()(我相信toPandas()会固有地使用) 探索了很多关于SO的帖子,但是AFAIK都没有toPandas()问题. 我的数据帧快照:- >>sc.versi
..
我的操作系统是OS X 10.11.6. 我正在运行Spark 2.0,Zeppelin 0.6,Scala 2.11 当我在Zeppelin中运行此代码时,我收到了Jackson的异常消息. 当我在spark-shell中运行此代码时-也不例外. val filestream = ssc.textFileStream("/Users/davidlaxer/first-edition/
..
如何在Zeppelin中导入其他依赖项? 我正试图用apache zeppelin导入一个库(鞍形),但是... import org.saddle._ :21: error: object saddle is not a member of package org import org.saddle._ ^ 我已经尝试过使用%
..
我已经用cloudera设置了我的hadoop.我想安装Zeppelin与蜂巢连接,并为我的查询构建UI.使用以下命令构建zeppelin命令时: sudo mvn clean package -Pspark-1.3 -Dspark.version=1.3.0 -Dhadoop.version=2.6.0-cdh5.4.7 -Phadoop-2.6 -Pyarn -DskipTests
..
我正在Amazon EMR中运行Apache Zeppelin 0.8.0.最近,Spark解释器开始无法下拉库依赖关系.这是因为zeppelin.interpreter.dep.mvnRepo配置参数设置为 http://repo1.maven.org /maven2/,并且maven存储区最近已停止支持http,如下所示:根据Maven文档,我将此参数的值更新为 https://repo1.m
..
我想在齐柏林飞艇笔记本中漂亮地打印相关结果: val Row(coeff: Matrix) = Correlation.corr(data, "features").head 实现此目的的一种方法是将结果转换为DataFrame,并将每个值放在单独的列中,然后调用z.show(). 但是,请查看还有另一种直接的方法可以实现这一目标吗? 编辑: 数据框有50列.仅仅转换为
..
我正在尝试从Kubernetes集群中的Zeppelin部署中运行Spark作业.我也有在不同名称空间上运行的Spark Shuffle服务(守护程序-v2.2.0-k8s).这是我的火花配置(在齐柏林飞艇上设置) --conf spark.kubernetes.executor.docker.image= --conf spark.executor.cor
..
我正在尝试使用Zeppelin(Windows 10上的v 0.7.0 Java 1.8;与 docker v .0.7.1)用于查询Oracle数据库的JDBC解释器. 到目前为止,我已经找到了示例之类的论文.我尝试将jdbc解释器用于: common.max_count=100 default.driver=oracle.jdbc.pool.OracleDataSource de
..
我想使用齐柏林飞艇(Zeppelin)在Redshift中浏览我的数据.一个带有Spark的小型EMR集群正在运行.我正在加载databricks的spark-redshift库 %dep z.reset() z.load("com.databricks:spark-redshift_2.10:0.6.0") 然后 import org.apache.spark.sql.DataF
..
我正在尝试通过将它与d3.js集成来为Apache Zeppelin添加更多可视化选项 我找到了一个例子,其中有人用leaflet.js 这里,并尝试做类似的事情 - 不幸的是我对angularJS不太熟悉(Zeppelin用来解释前端的东西)语言)。我也没有流数据。下面是我的代码,只使用d3.js中的简单教程示例 %angular
..
如何降级spark版本?什么可能是其他解决方案?我必须使用spark会话连接我的配置单元表来激发。但是zeppelin不支持spark版本。 解决方案 这里有两个原因。 Zeppelin 0.7.2将spark 2.2+标记为不支持的版本。 https://github.com/apache/zeppelin/blob/v0.7.2/spark/src/main/java/or
..
尝试执行 %hive 显示数据库 抛出: 'BLOCKQUOTE> org.apache.hive.jdbc.HiveDriver类抛出java.lang.ClassNotFoundException java.net.URLClassLoader.findClass(URLClassLoader.java:381) java.lang.ClassLo
..
我尝试将我的apache zeppelin与我的配置单元Metastore连接起来。我使用zeppelin 0.7.3,因此不存在只有jdbc的配置单元解释器。我已将我的hive-site.xml复制到zeppelin conf文件夹,但我不知道如何创建新的配置单元解释器。 我也尝试通过spark的配置单元环境访问配置单元表,但是当我尝试这种方式时,我看不到我的配置单元数据库只显示默认数据库
..
我正在尝试Apache zeppelin。我想要有高潮。所以我想使用%html解释器。我已经完成了这项工作 print(“%html
Hello World !!”) 它非常完美。知道我有高级代码
..
Apache Zeppelin 对 AngularJS 。虽然Scala和Javascript之间存在差距。 我正在尝试添加 Highcharts 支持齐柏林来填补这个空白。主要目标是直接从 Spark DataFrame 。 经过几轮重构后,我想出了以下界面。 github.com/knockdata/zeppelin-highcharts 以下是两个选项。 哪个选项更好
..
我在我的centOS系统上安装了zeppelin。它没有在JDBC解释器下列出配置单元。 我的系统上安装了配置单元。 Hive metastore和hiveserver2正在运行。 HIVE_HOME和HADOOP_HOME设置正确。 Zeppelin编辑器出错: paragraph_1490339323949_-1789938581's Interpreter hive no
..
我是zeppelin的新手,尝试在我的系统上安装齐柏林飞艇。 直到现在,我已经完成了以下步骤: 从 here 在我的系统环境变量中设置JAVA_HOME。 转到zeppelin-0.7.3-bin-all \bin并运行zeppelin.cmd 可以在 http:// localhost:8090 当我试图运行将数据加载到表中在zeppelin tutotial中提到的程序 -
..
我正在使用本教程在码头集装箱中的纱线模式下产生群集以在纱线模式下在火花群集中启动齐柏林飞艇。然而我卡在第4步。我找不到在我的码头集装箱conf / zeppelin-env.sh进行进一步的配置。我试图把这些配置文件夹的齐柏林,但现在成功了。除此之外,齐柏林笔记本电脑也未在localhost:9001上运行。 我对分布式系统非常陌生,如果有人可以帮助我在纱线模式下启动spark集群上的zep
..
在尝试在Windows 10上安装和配置Apache Zeppelin时出现以下错误: org.apache.zeppelin。 interpreter.InterpreterException:文件名, 目录名称或卷标语法不正确 at org.apache.zeppelin.interpreter.remote.RemoteInterpreterManagedProcess.start
..