Чтобы отметить 100 000-й вопрос в теге r, я бы хотел создать список имен всех авторов пакета на CRAN.
Первоначально я думал, что смогу сделать это с помощью available.packages()
, но, к сожалению, это не содержит столбца авторов.
pdb <- available.packages()
colnames(pdb)
[1] "Package" "Version" "Priority"
[4] "Depends" "Imports" "LinkingTo"
[7] "Suggests" "Enhances" "License"
[10] "License_is_FOSS" "License_restricts_use" "OS_type"
[13] "Archs" "MD5sum" "NeedsCompilation"
[16] "File" "Repository"
Эта информация доступна в файле DESCRIPTION
для каждого пакета. Поэтому я могу думать о двух способах грубой силы, ни одна из которых не очень элегантна:
-
Загрузите каждый из 6,878 пакетов и прочитайте файл
DESCRIPTION
, используяbase::read.dcf()
-
Очистите каждую страницу пакета на CRAN. Например, https://cran.r-project.org/web/packages/MASS/index.html сообщает мне, что Брайан Рипли является автором МАССЫ.
Я не хочу загружать весь CRAN, чтобы ответить на этот вопрос. И я также не хочу очищать HTML, поскольку информация в файле DESCRIPTION является аккуратно отформатированным списком объектов person
(см. ?person
).
Как я могу использовать информацию о CRAN для простой сборки списка авторов пакетов?