Я играю с анализом настроений, и я ищу некоторые данные о семени. Есть ли бесплатный словарь?
Это может быть очень просто: 3 набора текстов/предложений, для "положительных", "отрицательных", "нейтральных". Это не должно быть огромным.
В конце концов, я, вероятно, создам свои собственные данные семян для моего конкретного варианта использования, но было бы здорово, если бы у меня было что-то, чтобы играть, пока я строю вещь.
Ответ 1
Bing Liu и Minqing Hu из UIC имеют ряд наборов данных:
Bo Pang от Корнелла есть еще несколько.
Ответ 2
Если вас интересуют словари настроений, многие авторы представили работу, основанную на вручную построенных списках, и другие полуавтоматические методы для получения списков упрямых терминов. Один хороший подход - получить его из базы данных WordNet, расширив ядро положительных/отрицательных слов, используя отношения, такие как синонимы и т.д.
Хорошим примером списка, созданного вручную, является General Inquirer.
Для полуавтоматического метода, который выводит списки, просмотрите SentiWordNet от Esuli и Sebastiani.
Я считаю, что они вообще доступны для исследований, но вам может потребоваться связаться с авторами относительно использования этих ресурсов для целей, не связанных с исследованиями.
В.
Ответ 3
Здесь вы можете использовать список слов AFINN:
http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010
AFINN - это список английских слов, оцененных для валентности с целым числом между минус пять (отрицательный) и плюс пять (положительный). Слова был вручную помечен Финном Årup Nielsen в 2009-2011 годах. Файл Вкладка разделенных. Существуют две версии:
AFINN-111: самая новая версия с 2477 словами и фразами.
AFINN-96: 1468 уникальных слов и фраз на 1480 строк. Обратите внимание, что 1480 строк, так как некоторые слова перечислены дважды. Список слов в не полностью в алфавитном порядке.
Ответ 4
Я поддерживаю список корпусов и списков слов для анализа настроений (где мой AFINN является одним из них):
http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Corpora
http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Affective_word_lists