Я собираю много действительно интересных точек данных, поскольку пользователи приходят на мой веб-сервис Python. Например, у меня есть их текущий город, штат, страна, пользовательский агент и т.д. Что бы я хотел сделать, это запустить их через какую-то систему машинного обучения/алгоритм (может быть, байесовский классификатор?), С конечная цель получения уведомлений по электронной почте, когда происходит что-то необычное (обнаружение аномалий). Например, Джейн Доу только что вышла из США в Chrome. Поэтому, если она вдруг войдет в мой веб-сервис из Украины в Firefox, я хочу увидеть это как очень "необычное" событие и отключить уведомление.
Я уже использую CouchDB (в частности, с Cloudant), и я вижу, что люди часто говорят здесь и там в Интернете, что Cloudant/CouchDB идеально подходит для такого рода вещей (большой анализ данных). Однако я начинаю с полной потери. Я не нашел многого с точки зрения документации относительно относительно простого отслеживания отдаленных событий для веб-службы, не говоря уже о сохранении ранее "выученных" данных с помощью CouchDB. Я вижу несколько специализированных систем для выполнения этого типа хруста данных (PredictionIO приходит на ум), но я не могу не чувствовать, что они чрезмерны, учитывая природу CouchDB.
Любое понимание было бы очень оценено. Спасибо!