Я пытаюсь очистить данные с защищенного паролем веб-сайта в R. Просматривая, кажется, что httr и RCurl-пакеты являются лучшими вариантами для очистки с аутентификацией пароля (я также рассмотрел пакет XML).
Веб-сайт, который я пытаюсь очистить, ниже (вам нужна бесплатная учетная запись для доступа к полной странице): http://subscribers.footballguys.com/myfbg/myviewprojections.php?projector=2
Вот мои две попытки (заменив "имя пользователя" моим именем пользователя и "паролем" на мой пароль):
#This returns "Status: 200" without the data from the page:
library(httr)
GET("http://subscribers.footballguys.com/myfbg/myviewprojections.php?projector=2", authenticate("username", "password"))
#This returns the non-password protected preview (i.e., not the full page):
library(XML)
library(RCurl)
readHTMLTable(getURL("http://subscribers.footballguys.com/myfbg/myviewprojections.php?projector=2", userpwd = "username:password"))
Я просмотрел другие соответствующие сообщения (ссылки ниже), но не могу понять, как применить их ответы на мой случай.
Как использовать R для загрузки заархивированного файла с SSL-страницы, требующей куки файлов.
Как подключить защищенные страницы в R (https-ссылки) (используя readHTMLTable из пакета XML)?
Чтение информации с защищенного паролем сайта
R - RCurl очистить данные с защищенного паролем сайта
http://www.inside-r.org/info/how-scrape-data-password-protected-https-website-using-r-hold