Я пытаюсь вырезать символы \r\n\t с помощью scrapy spider, создавая json файл.
У меня есть объект описания, который заполнен новыми строками, и он не выполняет то, что я хочу: сопоставление каждого описания с заголовком.
Я попытался с картой (unicode.strip()), но на самом деле это не работает. Являясь новатором для исследования, я не знаю, есть ли еще один более простой способ или как работает unicode карты.
Это мой код:
def parse(self, response):
for sel in response.xpath('//div[@class="d-grid-main"]'):
item = xItem()
item['TITLE'] = sel.xpath('xpath').extract()
item['DESCRIPTION'] = map(unicode.strip, sel.xpath('//p[@class="class-name"]/text()').extract())
Я попробовал также:
item['DESCRIPTION'] = str(sel.xpath('//p[@class="class-name"]/text()').extract()).strip()
Но это вызвало ошибку. Какой лучший способ?