Я пытаюсь разобрать кучу xml файлов с библиотекой xml.dom.minidom, чтобы извлечь некоторые данные и поместить их в текстовый файл. Большинство XML файлов идут хорошо, но для некоторых из них я получаю следующую ошибку при вызове minidom.parsestring():
UnicodeEncodeError: кодек ascii не может кодировать символ u '\ u2019' в позиции 5189: порядковый номер не в диапазоне (128)
Это происходит и для некоторых других символов, отличных от ascii. Мой вопрос: какие у меня варианты? Должен ли я каким-то образом убрать/заменить все те неанглийские символы, прежде чем разбираться с XML файлами?