Когда резервный распределенный набор данных (RDD) создается из текстового файла или коллекции (или из другого RDD), нужно ли нам явно указывать "кеш" или "упорствовать", чтобы хранить данные RDD в памяти? Или данные по RDD, хранящиеся распределенным способом в памяти по умолчанию?
val textFile = sc.textFile("/user/emp.txt")
В соответствии с моим пониманием, после вышеупомянутого шага, textFile является RDD и доступен во всех/некоторых из памяти node.
Если да, почему нам нужно вызывать "кеш" или "упорствовать" на текстовом RDD, то?