Я пытаюсь выяснить, возможно ли "инкрементное обучение" с использованием MLlib в Apache Spark.
Моя платформа - это Prediction IO, и это в основном оболочка для Spark (MLlib), HBase, ElasticSearch и некоторых других полезных частей.
В моем приложении данные "события" вставляются в режиме реального времени, но для получения обновленных результатов прогнозирования мне нужно "pio train" и "pio deploy". Это занимает некоторое время, и сервер отключается во время повторного развертывания.
Я пытаюсь выяснить, могу ли я делать инкрементное обучение во время фазы "предсказания", но не могу найти ответ.