什么时候需要持久化以及什么时候需要取消对RDD的持久化 [英] When to persist and when to unpersist RDD in Spark

查看：260 发布时间：2020/9/4 8:40:52 scala hadoop apache-spark rdd

本文介绍了什么时候需要持久化以及什么时候需要取消对RDD的持久化的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

让我说以下内容:

 val dataset2 = dataset1.persist(StorageLevel.MEMORY_AND_DISK) 
 val dataset3 = dataset2.map(.....)

如果您对数据集2进行了转换，那么您必须将其持久化并将其传递给数据集3并取消保留先前的数据吗?

If you do a transformation on the dataset2 then you have to persist it and pass it to dataset3 and unpersist the previous or not?

我正在尝试确定何时保留和持久保留RDD.每创建一个新的rdd，我都必须坚持吗?

I am trying to figure out when to persist and unpersist RDDs. With every new rdd that is created do i have to persist it?

谢谢