Я пытаюсь понять, как искра работает на кластере/клиенте YARN. У меня есть следующий вопрос в моем сознании.
-
Нужно ли, чтобы искра была установлена на всех узлах кластера пряжи? Я думаю, это должно потому, что рабочие узлы в кластере выполняют задачу и должны иметь возможность декодировать код (искровые API) в искровом приложении, отправленном кластеру драйвером?
-
В документации "Убедитесь, что
HADOOP_CONF_DIR
илиYARN_CONF_DIR
указывает на каталог, содержащий файлы конфигурации (клиентской стороны) для кластера Hadoop". Почему клиент node должен установить Hadoop при отправке задания в кластер?