Мне нужно прочитать текстовый файл в Python. Кодировка файла:
file -bi test.csv
text/plain; charset=us-ascii
Это сторонний файл, и каждый день я получаю новый, поэтому я не хочу его менять. Файл имеет не ascii-символы, например,.... Мне нужно прочитать строки, используя python, и я могу позволить себе игнорировать строку с символом, отличным от ascii.
Моя проблема в том, что когда я читаю файл на Python, я получаю UnicodeDecodeError при достижении строки, где существует символ без ascii, и я не могу прочитать остальную часть файла.
Есть ли способ избежать этого. Если я попробую это:
fileHandle = codecs.open("test.csv", encoding='utf-8');
try:
for line in companiesFile:
print(line, end="");
except UnicodeDecodeError:
pass;
то, когда ошибка достигнута, цикл for заканчивается, и я не могу прочитать оставшийся файл. Я хочу пропустить линию, которая вызывает ошибку, и продолжайте. Я бы предпочел не делать никаких изменений во входном файле, если это возможно.
Есть ли способ сделать это? Большое вам спасибо.