Мне нужно заменить все символы не-ASCII (\ x00-\x7F) пробелом. Я удивлен, что в Python это не так легко, если я ничего не пропустил. Следующая функция просто удаляет все символы, отличные от ASCII:
def remove_non_ascii_1(text):
return ''.join(i for i in text if ord(i)<128)
И этот заменяет не-ASCII-символы количеством пробелов в соответствии с количеством байтов в кодовой точке символа (т.е. символ –
заменяется на 3 пробела):
def remove_non_ascii_2(text):
return re.sub(r'[^\x00-\x7F]',' ', text)
Как заменить все символы, отличные от ASCII, на одно пространство?
myriad аналогичный qaru.site/info/40598/... questions, none адрес character замена как напротив , и дополнительно адресуйте все символы не-ascii, а не определенный символ.