Когда я запускаю задание Spark и сохраняю вывод в виде текстового файла, используя метод "saveAsTextFile", как указано в https://spark.apache.org/docs/0.9.1/api/core/index.html#org.apache.spark.rdd.RDD:
здесь создаются файлы:
Является ли файл .crc Cyclic Redundancy Check file? и поэтому используется для проверки правильности содержимого каждого сгенерированного файла?
Файл _SUCCESS всегда пуст, что это означает?
В файлах, которые не имеют расширения на скриншоте выше, содержатся фактические данные из RDD, но почему многие файлы генерируются вместо одного?