Я попытался найти stackoverflow, чтобы найти ответ на этот вопрос, но вопросы и ответы, которые я нашел, составляют около 10 лет, и я не могу найти консенсуса по этому вопросу из-за изменений и возможного прогресса.
Есть несколько библиотек, которые мне известны за пределами stl, которые должны обрабатывать unicode-
- http://userguide.icu-project.org/
- https://github.com/nemtrif/utfcpp
- https://github.com/CaptainCrowbar/unicorn-lib
Есть несколько особенностей stl (wstring, codecvt_utf8), которые были включены, но люди, как представляется, неоднозначны в использовании, потому что они имеют дело с UTF-16, которые этот сайт: (utf-8 везде) не должны использоваться, и многие люди онлайн, похоже, согласны с предпосылкой.
Единственное, что я ищу, это способность делать 4 вещи с помощью unicode strings-
- Чтение строки в память
- Найдите строку с регулярным выражением, используя unicode или ascii, объедините или замените/форматируйте текст с помощью либо символов ascii + unicode, либо символов.
- Преобразуйте в ascii + формат номера юникода для символов, которые не соответствуют диапазону ascii.
- Напишите строку на диск или отправьте где угодно.
Из того, что я могу сказать, icu обрабатывает это и многое другое. Я хотел бы знать, есть ли стандартный способ обработки этого в Linux, Windows и MacOS.
Спасибо за ваше время.