Я использую spark 1.5.2
. Мне нужно запустить искрообразование с кафкой в качестве источника потоковой передачи. Мне нужно читать из нескольких тем в кафке и обрабатывать каждую тему по-разному.
- Это хорошая идея сделать это в той же работе? Если да, должен ли я создать единый поток с несколькими разделами или разными потоками для каждой темы?
- Я использую прямой кафка. Насколько я знаю, искра запускает длинные приемники для каждого раздела. У меня относительно небольшой кластер, 6 узлов с 4 ядрами каждый. Если у меня будет много тем и разделов в каждой теме, повлияет ли эффективность, так как большинство исполнителей заняты длинными приемниками? Пожалуйста, исправьте меня, если мое понимание здесь не так.