Я хотел бы проанализировать веб-страницу http://dcsd.nutrislice.com/menu/meadow-view/lunch/, чтобы взять сегодня обеденное меню. (Я построил термопринтер Adafruit #IoT, и я хотел бы автоматически распечатывать меню каждый день.)
Сначала я подошел к этому с помощью BeautifulSoup, но оказалось, что большая часть данных загружена в JavaScript, и я не уверен, что BeautifulSoup может ее обработать. Если вы просмотрите источник, вы увидите соответствующие данные, хранящиеся в bootstrapData['menuMonthWeeks']
.
import urllib2
from BeautifulSoup import BeautifulSoup
url = "http://dcsd.nutrislice.com/menu/meadow-view/lunch/"
soup = BeautifulSoup(urllib2.urlopen(url).read())
Это простой способ получить исходный код и просмотреть.
Мой вопрос: какой самый простой способ извлечь эти данные, чтобы я мог что-то с этим сделать? Буквально, все, что я хочу, это строка вроде:
Юго-западный омлет для сыра, картофельные клинья, батончик для сбора урожая (THB), THB - хлеб с чистым песто, сэндвич с ветчиной, красные перцовые палочки, клубника
Я думал об использовании webkit для обработки страницы и получения HTML (т.е. того, что делает браузер), но это кажется излишне сложным. Я бы предпочел просто найти то, что может анализировать данные bootstrapData['menuMonthWeeks']
.