Вопрос
Итак, я недавно придумал несколько новых возможных проектов, которые должны были бы иметь дело с получением "значения" из текста, представленного и созданного пользователями.
Обработка естественного языка - это область, которая занимается этими проблемами, и после некоторых начальных исследований я нашел OpenNLP Hub и сотрудничество в университете, например tryo project. И stackoverflow имеет этот.
Если бы кто-нибудь мог связать меня с некоторыми хорошими ресурсами, из резюме документов и вступительных текстов в apis, я был бы счастливее, чем 6-летний ребенок, открывший рождественские подарки!
Update
В рамках одной из ваших рекомендаций я нашел opencyc ( "самая большая в мире и самая полная общая база знаний и здравый смысл" ). Еще более удивительно, что существует проект, который является дистиллированной версией opencyc, называемой UMBEL. Он содержит семантические данные в синтаксисе rdf/owl/skos n3.
Я также наткнулся на antlr, генератор синтаксического анализатора для 'создания распознавателей, интерпретаторов, компиляторов и переводчиков из грамматических описаний.
И здесь есть вопрос, в котором перечислены тонны бесплатных и открытых данных.
Благодаря сообществу stackoverflow!