Flink был по сравнению с Spark, который, как я вижу, является неправильным сравнением, поскольку он сравнивает оконную систему обработки событий с микрозарядом; Точно так же это не имеет большого значения для меня, чтобы сравнить Флинка с Самсой. В обоих случаях он сравнивает в реальном времени и стратегию пакетной обработки событий, даже если в меньшем "масштабе" в случае Samza. Но я хотел бы знать, как Flink сравнивается со Storm, который кажется концептуально более похожим на него.
Я нашел этот (слайд 4), документирующий основное различие как "регулируемое время ожидания" для Flink. Другим намеком является статья Slicon Angle, в которой предполагается, что Flink лучше интегрируется в мир Spark или HadoopMR, но никакие фактические данные не упоминаются или не упоминаются, Наконец, сам Фабиан Хюске отмечает в интервью: "По сравнению с Apache Storm функциональность анализа потока Flink предлагает API высокого уровня и использует более легкую стратегию отказоустойчивости, обеспечивающую точно определенные гарантии обработки".
Все, что для меня немного скудное, и я не совсем понимаю. Может кто-нибудь объяснить, какая проблема (с?) С потоковой обработкой в Storm (есть?), Точно решена Flink? Что такое Hueske, ссылаясь на проблемы API и их "более легкую стратегию отказоустойчивости"?