Может ли кто-нибудь указать какой-нибудь примерный код, чтобы снять диакритические знаки (т.е. заменить символы с акцентами, умлауты и т.д. с их несогласованными, незанятыми и т.д. эквивалентами символов, например, каждый акцент é
станет простой ASCII e
) из UnicodeString
с использованием библиотеки ICU в С++? Например:.
UnicodeString strip_diacritics( UnicodeString const &s ) {
UnicodeString result;
// ...
return result;
}
Предположим, что s
уже нормализовано. Спасибо.