Я использую lxml для разбора html файлов с указанными URL-адресами.
Например:
link = 'https://abc.com/def'
htmltree = lxml.html.parse(link)
Мой код хорошо работает для большинства случаев, с http://
. Тем не менее, я нашел для каждого https://
url, lxml просто получает IOError. Кто-нибудь знает причину? И, возможно, как исправить эту проблему?
Кстати, я хочу придерживаться lxml, а не переключаться на BeautifulSoup, поскольку у меня уже есть готовая программа.