Лучший алгоритм обучения для создания дерева решений в java?

У меня есть данные с информацией, такой как возраст, город, возраст детей... и результат (подтвердить, принять).

Чтобы помочь моделировать "рабочий процесс", я хочу автоматически создать дерево решений на основе предыдущих наборов данных.

Я смотрю http://en.wikipedia.org/wiki/Decision_tree_learning, и я знаю, что проблема явно не очевидна.

Я просто хочу получить совет по некоторым алгоритмам или некоторым библиотекам на эту тему, что может помочь мне в построении дерева решений на основе образцов.

Ответ 1

Вы должны взглянуть на Weka, бесплатный обучаемый пакет на основе Java.

После преобразования ваших данных в Weka простой текстовый . формат arff, вы должны иметь возможность использовать интерфейс GUI или командной строки для тренировать и тестировать множество разных классификаторов по этим данным, включая:

  • деревья решений
  • нейронные сети
  • системы на основе правил
  • поддерживающие векторные машины (SVM)
  • различные типы регрессии

Экспериментируя с этим интерфейсом, вы должны легко попробовать разные классификаторы и параметры обучения, чтобы определить, какие из них лучше всего подходят для ваших данных.

Вы также можете использовать API для интеграции Weka в свой собственный исходный код.

Ответ 2

Если вы хотите сравнить производительность разных типов деревьев решений от Weka, см. результаты тестов, собранные в TunedIT.org:

http://tunedit.org/results?d=UCI&a=Weka*tree.

Слушайте с раскрывающимися списками и шаблонами имен алгоритмов/наборов данных, чтобы выбрать, какие результаты должны быть представлены.