Spark Scala:检索架构并存储它 [英] Spark Scala: retrieve the schema and store it

查看:31
本文介绍了Spark Scala:检索架构并存储它的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

是否可以检索 RDD 的模式并将其存储在变量中?因为我想使用相同的模式从另一个 RDD 创建一个新的数据框.例如,以下是我希望拥有的:

Is it possible to retrieve the schema of an RDD and store it in a variable? Because I want to create a new data frame from another RDD using the same schema. For example, below is what I am hoping to have:

val schema = oldDF.getSchema()
val newDF = sqlContext.createDataFrame(rowRDD, schema)

假设我已经有 RDD[org.apache.spark.sql.Row] 格式的 rowRDD ,这可能吗?

Assuming I already have rowRDD in the format of RDD[org.apache.spark.sql.Row] , is this something possible?

推荐答案

只需使用 schema 属性

val oldDF = sqlContext.createDataFrame(sc.parallelize(Seq(("a", 1))))
val rowRDD = sc.parallelize(Seq(Row("b", 2))

sqlContext.createDataFrame(rowRDD, oldDF.schema)

这篇关于Spark Scala:检索架构并存储它的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆