Я создал задание cron для моего сайта, которое запускается каждые 2 часа, и оно подсчитывает слова в каналах, а затем отображает 10 наивысших слов подсчета в качестве горячих тем.
Что-то, что твиттер делает на домашней странице, чтобы показать самые популярные темы, которые обсуждаются.
То, что делает моя работа cron прямо сейчас, это подсчет слов, за исключением слов, которые я упомянул, таких слов, как:
array('of', 'a', 'an', 'also', 'besides', 'equally', 'further', 'furthermore', 'in', 'addition', 'moreover', 'too',
'after', 'before', 'when', 'while', 'as', 'by', 'the', 'that', 'since', 'until', 'soon', 'once', 'so', 'whenever', 'every', 'first', 'last',
'because', 'even', 'though', 'although', 'whereas', 'while', 'if', 'unless', 'only', 'whether', 'or', 'not', 'even',
'also', 'besides', 'equally', 'further', 'furthermore', 'addition', 'moreover', 'next', 'too',
'likewise', 'moreover', 'however', 'contrary', 'other', 'hand', 'contrast', 'nevertheless', 'brief', 'summary', 'short',
'for', 'example', 'for instance', 'fact', 'finally', 'in brief', 'in conclusion', 'in other words', 'in short', 'in summary', 'therefore',
'accordingly', 'as a result', 'consequently', 'for this reason', 'afterward', 'in the meantime', 'later', 'meanwhile', 'second', 'earlier', 'finally', 'soon', 'still', 'then', 'third'); //words that are negligible
Но это не полностью решает проблему устранения всех ненужных слов. И дайте только слова, которые полезны.
Может кто-нибудь, пожалуйста, посоветуйте мне об этом и расскажите, как я могу улучшить свой алгоритм.
Отношения Zeeshan