Как я могу заставить Spark выполнить вызов для сопоставления, даже если он считает, что его не нужно выполнять из-за его ленивой оценки?
Я попытался поместить cache()
с вызовом карты, но это все еще не делает трюк. Мой метод карты фактически загружает результаты в HDFS. Итак, это не бесполезно, но Spark думает, что это так.