星火:排序由多个值的RDD在一个元组/列 [英] Spark: Sort an RDD by multiple values in a tuple / columns

查看:279
本文介绍了星火:排序由多个值的RDD在一个元组/列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

所以我有一个RDD如下:

So I have an RDD as follows

RDD[(String, Int, String)]

和作为一个例子

    ('b', 1, 'a')
    ('a', 1, 'b')
    ('a', 0, 'b')
    ('a', 0, 'a')

最后的结果应该是这个样子。

The final result should look something like

('a', 0, 'a')
('a', 0, 'b')
('a', 1, 'b')
('b', 1, 'a')

我怎么会做这样的事?

How would I do something like this?

推荐答案

试试这个:

rdd.sortBy(r => r)

如果你想切换周围的排序顺序,你可以这样做:

If you wanted to switch the sort order around, you could do this:

rdd.sortBy(r => (r._3, r._1, r._2))

有关反向顺序:

rdd.sortBy(r => r, false)

这篇关于星火:排序由多个值的RDD在一个元组/列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆