Я пытаюсь решить простую задачу классификации.
Проблема:
У меня есть набор текста, и я должен классифицировать их на основе содержимого.
Решение с использованием Mahout:
Я понял, что мне нужно преобразовать вход в файл последовательности для генерации модели. Да, я смог это сделать. Теперь, как я классифицирую свои тестовые данные? Пример 20News только проверяет правильность. Но я хочу сделать фактическую классификацию.
Я не уверен, что мне нужно написать код или использовать некоторые существующие классы, доступные для классификации набора тестов.