Специальные символы (смайлики) в текстовом файле

У меня есть txt файл для разговора, экспортированного из WhatsApp. WhatsApp поддерживает смайлики в их разговоре, а экспортированный разговор также, к моему удивлению, содержит эти смайлики! То есть, если я открываю текстовый файл в текстовом редакторе (Text Wrangler на Mac 10.8), я могу видеть смайлики. Текстовый файл закодирован в UTF-8, и нет ресурсов, связанных с файлом, который я могу сказать.

Может кто-нибудь объяснить мне, как эти смайлики включены в текстовый файл и как они точно интерпретируются текстовым редактором? Связано ли это с кодировкой символов? Включены ли дополнительные ресурсы в текстовый файл?

Ответ 1

Юникод содержит разделы, которые определяют emoji как "символы". Они обычные персонажи, вам нужен только шрифт, который может отображать их. Также см. Часто задаваемые вопросы Unicode Emoji.

В текстовом файле символы в основном кодируются как числа в виде байтов. Чтобы отобразить эти визуально на экране компьютера, вам понадобится шрифт, который содержит визуальный глиф для визуализации этого символа. Поскольку процесс всегда является числовым идентификатором → шрифтом → видимым глифом, должно быть довольно очевидно, что "персонаж" может быть визуальным, в том числе эможи или любым другим изображением.

character viewer