Скажем, у меня есть три функции преобразования RDD, вызываемые на rdd1:
def rdd2 = rdd1.f1
def rdd3 = rdd2.f2
def rdd4 = rdd3.f3
Теперь я хочу кэшировать rdd4
, поэтому я вызываю rdd4.cache()
.
Мой вопрос:
Будет ли кэшироваться только результат действия на rdd4
или будет ли кэширован каждый RDD выше rdd4
? Скажем, я хочу кэшировать как rdd3
, так и rdd4
, нужно ли их кэшировать отдельно?