Как загружать изображения программно из Wikimedia Commons без регистрации учетной записи Bot?

Похоже, что единственный способ получить одобрение для учетной записи бота - это добавить или изменить информацию, уже имеющуюся в Викимедиа. Если вы попытаетесь загрузить любые изображения без учетной записи бота, используя некоторые библиотеки api, вы получите сообщения об ошибках вместо изображений. Похоже, они блокируют кого-то, не заходящего из браузера? Кто-нибудь еще имеет опыт работы с этим? Я что-то здесь упускаю?

Ответ 1

Попробуйте объяснить, что именно вы хотите сделать? А что ты пробовал? Какое сообщение об ошибке вы получили? Вы не очень ясно...

Какие библиотеки вы пробовали? Если вы не агрессивны, нет никаких ограничений в загрузке контента WM. Я никогда не слышал о каких-либо ограничениях. Некоторым агентам пользователей запрещено редактировать, чтобы избежать глупого спама, но на самом деле я никогда не слышал об ограничениях на скачивание.

Если вы пытаетесь очистить огромное количество изображений, загружая их через Commons, вы делаете это неправильно (тм). Если вы пытаетесь получить несколько изображений, где-то от 10 до 200, вы сможете написать достойный инструмент в несколько строк кода, при условии, что вы соблюдаете требование регулирования: когда API говорит вам замедлиться, если вы этого не сделаете, системные администраторы, вероятно, выгонят вас.

Если вам нужен полный дамп образа (мы говорим о нескольких ТБ), попробуйте задать вопрос по wikitech-l. У нас были доступные торренты, когда было меньше изображений, теперь они более сложные, но все еще выполнимые.

О счетах ботов. Как глубоко вы посмотрели в системе? Вы нуждаетесь в учетной записи бота для быстрого, неконтролируемого редактирования. Привилегии ботов также открывают несколько возможностей, таких как увеличение размера запросов. Но помните: аккаунт бота? это просто дополненная учетная запись пользователя. Вы пробовали запустить что-нибудь с классическим аккаунтом?

Ответ 3

Обратите внимание, что когда-либо возникала проблема с использованием LWP: это нелогично, это практично, агенты могут создавать массивные нагрузки на уже растянутые серверы. Существуют разумные стратегии, которые могут выполнять пользователи-агенты, чтобы уменьшить нагрузку - спросите на www.mediawiki.org или en: Деревенский насос - Технический

Ответ 4

Если вам нужно от десяти до миллиона файлов, использование инструментов Magnus Manske для определения категорий является хорошим выбором. http://tools.wmflabs.org/magnustools/can_i_haz_files.html создает список команд UNIX, которые затем можно запускать локально.

Альтернатива, интерфейс которой только в Германии, но достаточно прост, https://tools.wmflabs.org/wikilovesdownloads/