如何在强类型 Spark 数据集上使用 Window 聚合? [英] How use Window aggrgates on strongly typed Spark Datasets?

查看：48 发布时间：2021/7/15 20:51:40 scala apache-spark apache-spark-dataset

本文介绍了如何在强类型 Spark 数据集上使用 Window 聚合?的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在缓慢地尝试适应 Spark 2.x 中的新(强类型)Dataset[U]，但在使用时努力维护类型信息窗口函数.

I'm slowely trying to adapt to the new (strongly typed) Dataset[U] from Spark 2.x, but struggling to maintain the type info when using Window functions.

case class Measurement(nb:Long,x:Double)

ds 是一个 Dataset[Measurement]，我想做类似的事情

ds being a Dataset[Measurement], I would like to do something like

ds.map{m => (m,sum($"x").over(Window.orderBy($"nb"))}

但这行不通(因为它给了我一个 Dataset[(Measurement,Column)])而不是 Dataset[(Measurement,Double)]

But this will not work (as it gives my a Dataset[(Measurement,Column)]) instead of Dataset[(Measurement,Double)]

使用 withColumn 给了我一个 Dataset[Row]，所以我丢失了类型信息:

Using withColumn gives me a Dataset[Row], so I'm loosing the type info:

ds.withColumn("cumsum",sum($"x").over(Window.orderBy($"nb")))

那么，有没有更好的方法在强类型的Datasets 上使用Window 函数?

So, is there a better way to use Window functions on strongly typed Datasets?

如何在强类型 Spark 数据集上使用 Window 聚合? [英] How use Window aggrgates on strongly typed Spark Datasets?

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

如何在强类型 Spark 数据集上使用 Window 聚合? [英] How use Window aggrgates on strongly typed Spark Datasets?

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭