У меня есть файл ASCII, содержащий EM Dash (- или — в HTML). Значение hex равно 0x97. Когда мы передаем этот файл через одно приложение, он появляется как UTF-8, и он преобразует символ в 0xC297, который является — в HTML. Однако, когда мы передаем этот файл через другое приложение, он преобразует символ в 0xE28094 или —.
Что может заставить эти приложения по-разному преобразовывать эти символы? Возможно, это настройка кодовой страницы?