спасибо за всю помощь, которую вы мне дали раньше.
У меня только один маленький вопрос, который, похоже, меня смутил.
TF-IDF и сходство с косинусом.
Я читал на обоих, а затем на wiki под сходством Косинус. Я нахожу это предложение: "В случае поиска информации косинус подобия двух документов будет варьироваться от 0 до 1, так как термин" частоты "(весы tf-idf ) не может быть отрицательным. Угол между двумя терминальными частотными векторами не может быть больше 90.
Теперь мне интересно... разве это не разные вещи?
Является ли tf-idf уже внутри подобия косинуса? Если да, то какая чертовщина? Я могу видеть только продукты внутренней точки и эвклидовые длины...
Я думал, что tf-idf - это то, что вы могли бы сделать, прежде чем использовать косинус-сходство в текстах. Я что-то пропустил? O.o