Я новичок в XPath, но могу видеть, насколько он силен. Я смотрю исходный код этой и просто хочу извлечь содержимое и имя пользователя из следующих двух частей страницы, что для простоты саке расположены в верхней части исходного кода.
content = "[Архив] Simburgur Live Stream [Offline] Gears of War 3"
<div class="username">Simburgur</div>
Вот мой код внутри R:
doc <- htmlParse("http://forums.epicgames.com/archive/index.php/t-672775.html")
xpathSApply(doc, "//head/meta[@name=\"description\"]")
который возвращает
[[1]]
<meta name="description" content="[Archive] Simburgur Live Stream [Offline] Gears of War 3" />
Очевидно, что в этом примере все, что я хочу, это то, что находится внутри кавычек content =, но я застрял и не могу заставить мое выражение возвращать нужную строку.
Повторяю. Я новичок в XPath.:)