Недавно я изучал Python и погружаюсь в создание веб-скребка. Ничего необычного; его единственная цель - вывести данные с веб-сайта ставок и внести эти данные в Excel.
Большинство вопросов разрешимы, и у меня неплохой беспорядок. Однако я столкнулся с массивным препятствием по одной проблеме. Если сайт загружает таблицу лошадей и перечисляет текущие цены ставок, эта информация не содержится ни в одном исходном файле. Подсказка заключается в том, что эти данные живут иногда, причем числа обновляются, очевидно, с какого-то удаленного сервера. HTML на моем ПК просто имеет отверстие, где их серверы проталкивают все интересные мне данные.
Теперь мой опыт работы с динамическим веб-контентом низкий, так что эта вещь - это то, с чем я сталкиваюсь.
Я думаю, что Java или Javascript - это ключ, это часто появляется.
Скребок - это просто механизм сравнения шансов. Некоторые сайты имеют API, но мне это нужно для тех, кто этого не делает. Я использую библиотеку scrapy с Python 2.7
Я извиняюсь, если этот вопрос слишком открытый. Короче говоря, мой вопрос: как можно использовать scrapy для очистки этих динамических данных, чтобы я мог его использовать? Чтобы я мог очистить данные ставок в реальном времени?