В чем разница между рабочим процессом Oozie, координатором и узлом

В чем разница между рабочим процессом Oozie, координатором и связкой?

Рабочий процесс Oozie определяет последовательность действий. И мы должны вызывать его вручную каждый раз, когда мы хотим, чтобы он запускался. Там, где один и тот же рабочий процесс может быть запланирован через координатора. Правильно ли это понимание?

Тогда что дополнительно в комплекте?

Думаю, он снова используется для планирования набора координаторов. Тогда почему нельзя назначить одного координатора для планирования другого координатора, как один рабочий процесс, может иметь другой под-рабочий процесс.

Ответ 1

Процедура:

Это последовательность действий. Он написан в xml, и действия могут быть уменьшены с карты, улей, свиней и т.д.

Координатор:

Это программа, которая запускает действия (обычно рабочие задания), когда выполняется множество условий. Условиями могут быть временная частота, другие внешние события и т.д.

Bundle:

Он определяется как абстракция oozie более высокого уровня, которая включает в себя набор заданий координатора. Мы можем указать время начала задания пакета.

Ответ 2

Рабочий процесс не имеет временных спецификаций для запуска любого задания hadoop. Работа координатора имеет временные спецификации о работе в координаторе.xml с использованием частотного тега. Работы коллективного координатора считаются заданием Bundle. В задании Bundle отдельные пользователи могут назначать свои собственные задания, используя их job.properties, для своих соответствующих заданий.

Ответ 3

Для моего понимания, используя bundle, можно сгруппировать пару координаторов, поэтому менеджеру лучше будет просматривать, запускать/останавливать...

Вероятно, у нас есть два конвейера данных: один для ведения журнала (сбор/анализ /ETL), один для бизнес-логики.

Затем я создаю два пакета для групп разных типов координаторов.