Я хочу прочитать кучу текстовых файлов из местоположения hdfs и выполнить сопоставление с ним на итерации с использованием искры.
JavaRDD<String> records = ctx.textFile(args[1], 1);
способен читать только один файл за раз.
Я хочу читать несколько файлов и обрабатывать их как один RDD. Как?