Я пытаюсь понять, как искра работает на кластере/клиенте YARN. У меня есть следующий вопрос в моем сознании.
-  Нужно ли, чтобы искра была установлена на всех узлах кластера пряжи? Я думаю, это должно потому, что рабочие узлы в кластере выполняют задачу и должны иметь возможность декодировать код (искровые API) в искровом приложении, отправленном кластеру драйвером? 
-  В документации "Убедитесь, что HADOOP_CONF_DIRилиYARN_CONF_DIRуказывает на каталог, содержащий файлы конфигурации (клиентской стороны) для кластера Hadoop". Почему клиент node должен установить Hadoop при отправке задания в кластер?




