Я заинтересован в извлечении троек (субъект, предикат, объект) из вопросов.
Например, я хотел бы преобразовать следующий вопрос:
Кто является женой президента США?
to:
(x, isWifeOf, y) и клин; (У, isPresidentof, США)
x и y не понимают, что мы должны найти, чтобы ответить на вопрос (/\ обозначает конъюнкцию).
Я прочитал много статей по этой теме, и я хотел бы выполнить эту задачу с использованием существующих парсеров, таких как парсер Stanford. Я знаю, что парсеры выводят 2 типа данных:
- дерево структуры синтаксического анализа (отношения окружения)
- Дерево зависимостей (отношения зависимостей)
В некоторых статьях пытаются создать тройки из дерева структуры синтаксического анализа (например, Triple Extraction from Sentences), однако этот подход кажется слишком слабый для решения сложных вопросов.
С другой стороны, деревья зависимостей содержат много необходимой информации для выполнения тройного извлечения. Многие документы требуют сделать это, однако я не нашел ни одного из них, который явно дает подробную процедуру или алгоритм. Большую часть времени авторы говорят, что они анализируют зависимости для создания троек в соответствии с некоторыми правилами, которые они не давали.
Кто-нибудь знает какую-либо бумагу с дополнительной информацией об извлечении (субъект, предикат, объект) из дерева зависимостей вопроса?