Есть ли способ получить заголовки от запроса, созданного с помощью Urllib2, или подтвердить HTTP-заголовки, отправленные с urllib2.urlopen?
Получить заголовки запроса для Urllib2.Request?
Ответ 1
Простой способ увидеть запрос (и заголовки ответов) - включить вывод отладки:
opener = urllib2.build_opener(urllib2.HTTPHandler(debuglevel=1))
Затем вы можете увидеть точные заголовки, отправленные/получаемые:
>>> opener.open('http://python.org')
send: 'GET / HTTP/1.1\r\nAccept-Encoding: identity\r\nHost: python.org\r\nConnection: close\r\nUser-Agent: Python-urllib/2.7\r\n\r\n'
reply: 'HTTP/1.1 200 OK\r\n'
header: Date: Tue, 14 Jun 2011 08:23:35 GMT
header: Server: Apache/2.2.16 (Debian)
header: Last-Modified: Mon, 13 Jun 2011 19:41:35 GMT
header: ETag: "105800d-486d-4a59d1b6699c0"
header: Accept-Ranges: bytes
header: Content-Length: 18541
header: Connection: close
header: Content-Type: text/html
header: X-Pad: avoid browser bug
<addinfourl at 140175550177224 whose fp = <socket._fileobject object at 0x7f7d29c3d5d0>>
Вы также можете установить с заголовками объектов urllib2.Request
перед выполнением запроса (и переопределить заголовки по умолчанию, хотя заранее не будут присутствовать в заголовках dict):
>>> req = urllib2.Request(url='http://python.org')
>>> req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0)')
>>> req.headers
{'User-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0)'}