Мое требование - принимать новостные статьи и определять, являются ли они положительными или отрицательными в отношении предмета. Я беру подход, описанный ниже, но я продолжаю читать НЛП, может быть полезен здесь. Все, что я прочитал, указывает на то, что НЛП обнаруживает мнение по факту, что, по-моему, не имеет большого значения в моем случае. Мне интересно две вещи:
1) Почему мой алгоритм не работает и/или как его улучшить? (Я знаю, что сарказм, вероятно, будет ловушкой, но опять же я не вижу, что многое происходит в новостях, которые мы будем получать)
2) Как помочь НЛП, почему я должен ее использовать?
Мой алгоритмический подход (у меня есть словари положительных, отрицательных и отрицательных слов):
1) Подсчитайте количество положительных и отрицательных слов в статье
2) Если слово отрицания найдено с 2 или 3 словами положительного или отрицательного слова (т.е. НЕ лучший), отрицайте результат.
3) Умножьте баллы по весам, которые были вручную назначены каждому слову. (1.0 для запуска)
4) Добавьте итоговые значения для положительных и отрицательных, чтобы получить оценку настроений.