Spark数据集写入之间的区别 [英] Difference between Spark dataset write
本文介绍了Spark数据集写入之间的区别的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在使用 Spark-Java .
我需要知道以下对Hadoop方法的写入之间是否存在差异(性能等):
I need to know If there is any diffrence (performance etc) between the following write to Hadoop methods:
ds.write().mode(mode).format("orc").save(path);
或
ds.write().mode(mode).orc(path);
谢谢.
推荐答案
没有区别
orc(path)
只是format("orc").save(path)
.json(path)
和csv(path)
的默认设置为write(path)
的write(path)
相同,没有格式为Parquet
Same applies for .json(path)
and csv(path)
with the default write(path)
with no format being Parquet
这篇关于Spark数据集写入之间的区别的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文