Что лучше? OpenCyc или ConceptNet?

Я делаю проект NLP, где мне нужно распознавать понятия в предложениях, чтобы найти другие подобные понятия. Я делаю это, чтобы вывести слова валентности из списка, который у меня уже есть. Я начал использовать WordNet, но это дало много противоречивых результатов. По противоречивым результатам я имею в виду разложения слов, которые имели противоречивые валентности.

Итак, теперь я смотрю ConceptNet и OpenCyc. Я уже реализовал ConceptNet, и все было очень легко, и мне это нравится. Проблема в том, что OpenCyc, похоже, имеет гораздо большую и более логически жесткую базу данных, что важно, когда я нашел так много "противоречий" в WordNet... Но я не знал бы, потому что я не пробовал.

Может ли кто-нибудь сказать мне, стоит ли потратить (значительное, для меня) усилия на реализацию OpenCyc или концептуальную систему достаточно хорошо, чтобы вывести слова валентности? Разве они разные?

Я буду рад объяснить себя дальше, если понадобится. Пытаюсь сохранить это на короткое время!

Спасибо!

Ответ 1

Это не стоит усилий. ConceptNet - это кучи, которые лучше и легче справляются.

Когда я использовал ConceptNet, нужно было загрузить базу данных sqlite и модуль python для доступа к отношениям в ней. Для OpenCyc это была большая загрузка, и ее нужно было настроить через веб-сервер, который занимал много времени для загрузки и использования огромного объема памяти. С тех пор все изменилось, но это был мой опыт.