Я реализую систему, которая могла бы обнаружить человеческие эмоции в тексте. Существуют ли какие-либо вручную аннотированные наборы данных для контролируемого обучения и тестирования?
Наборы данных для обнаружения эмоций в тексте
Ответ 1
Поле текстового обнаружения эмоций все еще очень новое, и литература фрагментирована во многих разных журналах разных областей. Его действительно трудно получить хороший взгляд на то, что там.
Обратите внимание, что существует несколько психологических теорий психологии. Следовательно, существуют разные способы моделирования/представления эмоций в вычислениях. В большинстве случаев "эмоция" относится к таким явлениям, как гнев, страх или радость. Другие теории утверждают, что все эмоции могут быть представлены в многомерном пространстве (поэтому их бесконечное число).
Вот некоторые (общедоступные) наборы данных, которые я знаю (обновлено):
-
EmoBank. 10k предложений, аннотированных значениями Valence, Arousal и Dominance (раскрытие: я один из авторов). https://github.com/JULIELab/EmoBank
-
Данные "Интенсивность эмоций в твитах", заданные из общей задачи WASSA 2017. http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html
-
The Valence и Arousal Facebook Сообщения от Preotiuc-Pietro и другие: http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv
-
Данные Affect: Cecilia Ovesdotter Alm: http://people.rc.rit.edu/~coagla/affectdata/index.html
-
Данные Emotion in Text, заданные CrowdFlower https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv
-
ISEAR: http://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615
-
Тестирование корпуса SemEval 2007 (задача по аффективному тексту) http://web.eecs.umich.edu/~mihalcea/downloads.html
-
Повторная передача данных SemEval Stance с эмоциями: http://www.ims.uni-stuttgart.de/data/ssec
Если вы хотите углубиться в эту тему, вот некоторые опросы, которые я рекомендую (раскрытие: я создал первый).
-
Buechel, S., and Hahn, U. (2016). Эмоциональный анализ как проблема регрессии - размерные модели и их последствия для представления эмоций и метрической оценки. В ECAI 2016.22-я Европейская конференция по искусственному интеллекту (стр. 1114-1122). Гаага, Нидерланды (доступно: http://ebooks.iospress.nl/volumearticle/44864).
-
Каналес, Л. и Мартинес-Барко, П. (н.д.). Обнаружение эмоций из текста: обзор. Обработка в 5 рабочих рабочих днях исследований информационных систем (JISIC 2014), 37 (доступно: http://www.aclweb.org/anthology/W14-6905).