Spark数据集写入之间的区别 [英] Difference between Spark dataset write

查看:80
本文介绍了Spark数据集写入之间的区别的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在使用 Spark-Java .

我需要知道以下对Hadoop方法的写入之间是否存在差异(性能等):

I need to know If there is any diffrence (performance etc) between the following write to Hadoop methods:

ds.write().mode(mode).format("orc").save(path);

ds.write().mode(mode).orc(path);

谢谢.

推荐答案

没有区别

orc(path)只是format("orc").save(path)

.json(path)csv(path)的默认设置为write(path)write(path)相同,没有格式为Parquet

Same applies for .json(path) and csv(path) with the default write(path) with no format being Parquet

这篇关于Spark数据集写入之间的区别的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆