Формула для IDF представляет собой log (N/df t), а не только N/df t.
Где N = общие документы в коллекции, а df t = частота документа в терминах t.
Говорят, что журнал используется, потому что он "гасит" эффект ИДФ. Что это значит?
Кроме того, почему мы используем взвешивание частоты в регистре для временной частоты, как показано здесь: