Похоже, что единственный способ получить одобрение для учетной записи бота - это добавить или изменить информацию, уже имеющуюся в Викимедиа. Если вы попытаетесь загрузить любые изображения без учетной записи бота, используя некоторые библиотеки api, вы получите сообщения об ошибках вместо изображений. Похоже, они блокируют кого-то, не заходящего из браузера? Кто-нибудь еще имеет опыт работы с этим? Я что-то здесь упускаю?
Как загружать изображения программно из Wikimedia Commons без регистрации учетной записи Bot?
Ответ 1
Попробуйте объяснить, что именно вы хотите сделать? А что ты пробовал? Какое сообщение об ошибке вы получили? Вы не очень ясно...
Какие библиотеки вы пробовали? Если вы не агрессивны, нет никаких ограничений в загрузке контента WM. Я никогда не слышал о каких-либо ограничениях. Некоторым агентам пользователей запрещено редактировать, чтобы избежать глупого спама, но на самом деле я никогда не слышал об ограничениях на скачивание.
Если вы пытаетесь очистить огромное количество изображений, загружая их через Commons, вы делаете это неправильно (тм). Если вы пытаетесь получить несколько изображений, где-то от 10 до 200, вы сможете написать достойный инструмент в несколько строк кода, при условии, что вы соблюдаете требование регулирования: когда API говорит вам замедлиться, если вы этого не сделаете, системные администраторы, вероятно, выгонят вас.
Если вам нужен полный дамп образа (мы говорим о нескольких ТБ), попробуйте задать вопрос по wikitech-l. У нас были доступные торренты, когда было меньше изображений, теперь они более сложные, но все еще выполнимые.
О счетах ботов. Как глубоко вы посмотрели в системе? Вы нуждаетесь в учетной записи бота для быстрого, неконтролируемого редактирования. Привилегии ботов также открывают несколько возможностей, таких как увеличение размера запросов. Но помните: аккаунт бота? это просто дополненная учетная запись пользователя. Вы пробовали запустить что-нибудь с классическим аккаунтом?
Ответ 2
Сделав это сам, я чувствую, что должен делиться:
http://www.mediawiki.org/wiki/API:Allimages
В этом документе API указано, что вы можете запросить изображения:
с помощью aiprop = url вам задан URL-адрес изображения, которое вы ищете.
Ответ 3
Обратите внимание, что когда-либо возникала проблема с использованием LWP: это нелогично, это практично, агенты могут создавать массивные нагрузки на уже растянутые серверы. Существуют разумные стратегии, которые могут выполнять пользователи-агенты, чтобы уменьшить нагрузку - спросите на www.mediawiki.org или en: Деревенский насос - Технический
Ответ 4
Если вам нужно от десяти до миллиона файлов, использование инструментов Magnus Manske для определения категорий является хорошим выбором. http://tools.wmflabs.org/magnustools/can_i_haz_files.html создает список команд UNIX, которые затем можно запускать локально.
Альтернатива, интерфейс которой только в Германии, но достаточно прост, https://tools.wmflabs.org/wikilovesdownloads/
Ответ 5
Не нашел ответ, который я ищу.. но эта страница интересна:: http://www.makeuseof.com/tag/4-free-tools-for-taking-wikipedia-offline/
Особенно # 4.. но кажется, что страница не работает.. проект мертв?