Предотвратите спам MediaWiki

В настоящее время сайт My MediaWiki находится под атакой спамеров. Ежедневно регистрируется около 10 спам-страниц.

Что я уже сделал:

  • Только пользователи с подтвержденными сообщениями электронной почты могут создавать/редактировать страницы.
  • виджет ReCAPTCHA. Captcha отображается в действиях:
    • 'edit' - срабатывает при каждой попытке сохранения страницы
    • 'create' - срабатывает при создании страницы
    • 'addurl' - срабатывает при сохранении страницы, что добавит один или несколько URL-адресов на страницу
    • 'createaccount' - срабатывает при создании новой учетной записи
  • Прокси-сервер
  • SpamBlacklist

Что еще я могу сделать, чтобы остановить спам?

Ответ 1

Это контр-интуитивно понятное, но я нашел эту комбинацию очень эффективной:

  • Отключить новые регистрации или, если вы считаете, что это слишком экстремально, установите SecurePages
  • Установите SimpleAntiSpam
  • Установите SpamBlacklist и TitleBlacklist
  • Разрешить анонимные изменения
  • Всегда блокируйте IP-адреса, которые спам отправлен из
  • Установите User Merge and Delete и используйте это, чтобы очистить существующие спам-аккаунты.

# 1 - самый важный шаг. Спамерам легко создавать резервные счета.
CAPTCHA делает лишь небольшую разницу, не стоит дополнительных затрат на пропускную способность для изображений. Сотни отложенных счетов являются почти такой же большой проблемой, как публикации спама.

# 2 уменьшает объем спама как минимум на 1/3.
Единственными роботами, которые проходят мимо SimpleAntiSpam, являются те, которые специально разработаны для MediaWiki, а не те, которые заполняют все textarea на каждой веб-странице везде. Аналогично, если ваш сайт имеет SSL, SecurePages (или его предшественник HttpsLogin) пресекает некоторые боты, у которых нет поддержки SSL.

# 3 перестанет повторяться одна и та же публикация спама (или ее варианты). Если вы регулярно обновляете черный список, который должен уменьшить объем спама еще на 10-20%.
И помните, что у спамеров будет нехватка платежных клиентов (вы удаляете один для каждого домена, на который вы блокируете ссылки) задолго до того, как у них заканчиваются публичные прокси-серверы/зомби для отправки.

# 4 не увеличивает объем спама столько, сколько вы могли ожидать. Там популярный бот MediaWiki-спам, который никогда не пытается анонимно анонсировать - он отказывается, когда не может найти ссылку "создать учетную запись".
И если вы этого не сделаете, у вас больше нет вики (у вас просто есть статический веб-сайт с использованием MediaWiki как CMS.)
Существует небольшой бонус - он упрощает поиск (и блокировку) IP-адресов спамеров. Конечно, вы можете получить IP-адреса, используя CheckUser, или, читая базу данных напрямую, но это намного проще, когда IP-адрес находится на виду.

# 5 - наименее эффективная мера, но это все равно стоит делать. Спамеры повторно используют IP-адреса. Они могут быть дешевыми, но они не бесконечны, и иногда вы поймаете одного из тех бегущих роботов, которые публикуют спам-страницу каждые 5 минут.

# 6 не предотвращает спам, но позволяет очистить страницу списка пользователей, когда у вас есть другие меры защиты от нежелательной почты.

Ответ 2

Возможно, вы можете проверить IP-адреса, используемые для рассылки спама?

Или используйте специальные вопросы вместо стандартного CAPTCHA? (например, один из сайтов, связанных с NetHack (roguelike), запрашивает символ ring/spellbok/potion - тривиальный для игроков NetHack, невозможно для ботов/наемных спам-решателей).

Ответ 3

Раньше у меня была ОГРОМНАЯ проблема со спамом на моей вики. Мне приходилось проходить через wiki каждый день и вручную удалять спам-сообщения, а затем блокировать адреса, но это было нескончаемое сражение. Ограничение редактирования зарегистрированным пользователям не помогло, поскольку спамеры только что зарегистрировались. Поэтому мне, наконец, пришлось закрыть сайт.

Я начал новую wiki, где мне удалось заблокировать все спам.

Моя вики предназначена для определенной профессиональной группы, поэтому я добавил добавление имени пользователя/пароля, которое должно было использоваться для доступа к каталогу wiki. Имя пользователя было отображено на моей домашней странице, поэтому никаких секретов нет. НО пароль был ответом на загадочный вопрос, который был выбран тщательно, поэтому ответ был легким для людей в моей профессиональной группе, чтобы отвечать, но очень тяжело для спамера и, конечно же, не то, что бот мог бы решить. Вопрос был выбран таким образом, чтобы ответ не был найден путем поиска Google по любому из слов - у меня была неправильная орфография и нестандартная аббревиатура в вопросе. Как выяснилось, около 1% моей целевой аудитории (в основном, не говорящих по-английски) нашли вопрос troo cryptic, поэтому альтернатива заключалась в том, чтобы связаться со мной по электронной почте, используя адрес электронной почты организации (не gmail или hotmail). Ответ был одним словом в нижнем регистре.

Я думал, что мне придется менять пароль так часто, НО через несколько лет не было отправлено ни одного сообщения о спаме, поэтому я оставил тот же вопрос.