Я пытаюсь обработать 4 каталога текстовых файлов, которые постоянно растут каждый день. Что мне нужно сделать, если кто-то пытается найти номер счета-фактуры, я должен предоставить им список файлов, которые у него есть.
Мне удалось сопоставить и уменьшить значения в текстовых файлах, загрузив их как RDD. Но как я могу получить имя файла и другие атрибуты файла?