Данные семян для анализа настроений

Я играю с анализом настроений, и я ищу некоторые данные о семени. Есть ли бесплатный словарь?

Это может быть очень просто: 3 набора текстов/предложений, для "положительных", "отрицательных", "нейтральных". Это не должно быть огромным.

В конце концов, я, вероятно, создам свои собственные данные семян для моего конкретного варианта использования, но было бы здорово, если бы у меня было что-то, чтобы играть, пока я строю вещь.

Ответ 2

Если вас интересуют словари настроений, многие авторы представили работу, основанную на вручную построенных списках, и другие полуавтоматические методы для получения списков упрямых терминов. Один хороший подход - получить его из базы данных WordNet, расширив ядро ​​положительных/отрицательных слов, используя отношения, такие как синонимы и т.д.

Хорошим примером списка, созданного вручную, является General Inquirer.

Для полуавтоматического метода, который выводит списки, просмотрите SentiWordNet от Esuli и Sebastiani.

Я считаю, что они вообще доступны для исследований, но вам может потребоваться связаться с авторами относительно использования этих ресурсов для целей, не связанных с исследованиями.

В.

Ответ 3

Здесь вы можете использовать список слов AFINN:

http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010

AFINN - это список английских слов, оцененных для валентности с целым числом между минус пять (отрицательный) и плюс пять (положительный). Слова был вручную помечен Финном Årup Nielsen в 2009-2011 годах. Файл Вкладка разделенных. Существуют две версии:

AFINN-111: самая новая версия с 2477 словами и фразами.

AFINN-96: 1468 уникальных слов и фраз на 1480 строк. Обратите внимание, что 1480 строк, так как некоторые слова перечислены дважды. Список слов в не полностью в алфавитном порядке.