Я использую scrapy для сканирования нескольких страниц на сайте.
Переменная start_urls используется для определения страниц, подлежащих обходу.
Сначала я начинал с 1-й страницы, определяя start_urls = [1st page] в файле example_spider.py
Получив больше информации с 1-й страницы, я бы определил, какие страницы будут сканироваться, а затем назначит start_urls соответственно. Следовательно, я должен перезаписать выше example_spider.py с изменениями в start_urls = [1st page, 2nd page, ..., Kth page], а затем снова запустить обход scrapy.
Это лучший подход или есть лучший способ динамически назначать start_urls с помощью scrapy API без перезаписывания example_splider.py?
Спасибо.