В этой статье http://www.ajnr.org/content/30/7/1402.full содержится четыре ссылки на html-таблицы, которые я хотел бы очистить с помощью rvest.
С помощью селектора css:
"#T1 a"
можно перейти к первой таблице следующим образом:
library("rvest")
html_session("http://www.ajnr.org/content/30/7/1402.full") %>%
follow_link(css="#T1 a") %>%
html_table() %>%
View()
css-селектор:
".table-inline li:nth-child(1) a"
позволяет выбрать все четыре html-узла, содержащие теги, связанные с четырьмя таблицами:
library("rvest")
html("http://www.ajnr.org/content/30/7/1402.full") %>%
html_nodes(css=".table-inline li:nth-child(1) a")
Как можно пропустить этот список и получить все четыре таблицы за один раз? Какой лучший подход?