Библиотека с открытым исходным кодом для лингвистического запроса и подсчета слов (LIWC)

Я ищу библиотеку с открытым исходным кодом для лингвистического запроса и подсчета слов (LIWC). Что-то в java или python будет хорошо, хотя я открыт для использования другого языка.

Кто-нибудь знает, где я могу его получить?

Приветствия,

Ответ 1

Как указывает ealdent, LIWC - это программное обеспечение и набор данных. Набор данных проприетарен, поэтому нет версии с открытым исходным кодом. Для софтверной стороны TAWC является полезной версией Perl с открытым исходным кодом. Из комментариев:

Это полусложный script, адаптированный к тому, который использовался в моем CHI документы. Задача этого script состоит в том, чтобы читать в регулярных выражениях из (или если они не являются RE, чтобы сделать их в RE), что должно быть обратно совместимый с программным обеспечением LIWC (c.f. http://www.liwc.net). Затем он подсчитывает количество совпадений для RE в одну строку ввода/пользователя и выводит ее для этой строки/пользователя.

Затем вы можете купить LIWClite, который составляет менее половины стоимости LIWC. Вы также можете бесплатно использовать TAWC со своими словарями.

Ответ 2

Вы можете найти полезный инструмент Natural Language Toolkit (NLTK) для Python: http://www.nltk.org/