Я делаю проект NLP, где мне нужно распознавать понятия в предложениях, чтобы найти другие подобные понятия. Я делаю это, чтобы вывести слова валентности из списка, который у меня уже есть. Я начал использовать WordNet, но это дало много противоречивых результатов. По противоречивым результатам я имею в виду разложения слов, которые имели противоречивые валентности.
Итак, теперь я смотрю ConceptNet и OpenCyc. Я уже реализовал ConceptNet, и все было очень легко, и мне это нравится. Проблема в том, что OpenCyc, похоже, имеет гораздо большую и более логически жесткую базу данных, что важно, когда я нашел так много "противоречий" в WordNet... Но я не знал бы, потому что я не пробовал.
Может ли кто-нибудь сказать мне, стоит ли потратить (значительное, для меня) усилия на реализацию OpenCyc или концептуальную систему достаточно хорошо, чтобы вывести слова валентности? Разве они разные?
Я буду рад объяснить себя дальше, если понадобится. Пытаюсь сохранить это на короткое время!
Спасибо!