Как получить результат "всех страниц с префиксом" с помощью Wikipedia api?

Я хочу использовать Wikipedia api для извлечения результата этой страницы:

http://en.wikipedia.org/wiki/Special:PrefixIndex

При поиске на нем "что-то", например:

http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4

Затем я хотел бы получить доступ к каждой из полученных страниц и извлечь их информацию.

Какой api-вызов я могу использовать?

Ответ 1

Вы можете использовать list=allpages и указать apprefix. Например:

http://en.wikipedia.org/w/api.php?format=xml&action=query&list=allpages&apprefix=tal&aplimit=max

Этот запрос даст вам идентификатор и заголовок каждой статьи, которая начинается с tal. Если вы хотите получить дополнительную информацию о каждой странице, вы можете использовать этот список как generator:

http://en.wikipedia.org/w/api.php?format=xml&action=query&generator=allpages&gapprefix=tal&gaplimit=max&prop=info

Вы можете указать разные значения для параметра prop для получения различной информации о странице.