Я разработал модель ML для задачи классификации (0/1) NLP и развернул ее в производственной среде. Прогноз модели отображается для пользователей, и пользователи имеют возможность оставить отзыв (если прогноз был правильным/неправильным).
Как я могу постоянно включать этот отзыв в мою модель? С точки зрения UX вы не хотите, чтобы пользователь исправлял/обучал систему более двух раз/трижды для конкретного ввода, система должна быстро учиться, то есть обратная связь должна быть включена "быстро". (Приоритетный почтовый ящик Google делает это без проблем)
Как построить этот "цикл обратной связи", с помощью которого моя система может улучшиться? Я много искал в сети, но не смог найти соответствующий материал. любые указатели будут очень полезны.
Пожалуйста, не говорите, что вы переучиваете модель с нуля, включая новые данные. Это точно не то, как Google и Facebook строят свои умные системы
Чтобы более подробно объяснить мой вопрос - подумайте о детекторе спама в Google или их приоритетном входящем почтовом ящике или их недавней функции "умных ответов". Это общеизвестный факт, что они имеют возможность изучать/включать (быстрый) пользовательский канал.
В то же время, когда он быстро учитывает обратную связь с пользователем (то есть пользователь должен обучать систему правильному выводу максимум 2-3 раза на одну точку данных, и система начинает давать правильный вывод для этой точки данных) И он также гарантирует, что он сохраняет старые знания и не начинает давать неправильные выходные данные на более старых точках данных (где он давал правильные выходные данные ранее) при включении обучения из новой точки данных.
Я не нашел ни одного блога/литературы/обсуждения о том, как создавать такие системы - интеллектуальная система, которая объясняет в цикле detaieback "в системах ML
Надеюсь, мой вопрос немного яснее.
Обновление: я нашел несколько связанных вопросов:
Поддерживает ли SVM в sklearn инкрементное (онлайн) обучение?
https://datascience.stackexchange.com/info/1073/libraries-for-online-machine-learning
http://mlwave.com/predicting-click-through-rates-with-online-machine-learning/
Обновление: у меня все еще нет конкретного ответа, но такой рецепт действительно существует. Прочитайте раздел "Обучение на основе обратной связи" в следующем блоге Машинное обучение! = Машинное обучение. В этом Джин говорит о "добавлении обратной связи в машину". То же самое в здесь, здесь, здесь4.