Световая библиотека Unicode

Я ищу небольшую библиотеку C для обработки строк utf8.

В частности, расщепление на основе разделителей unicode для использования с алгоритмами генерации.

Похожие сообщения предложили:

ICU http://www.icu-project.org/ (я нашел его слишком громоздким для своих целей на встроенных устройствах)

UTF8-CPP: http://utfcpp.sourceforge.net/ (Отлично, но С++ не C)

Кто-нибудь нашел какие-либо независимые от платформы небольшие библиотеки кода для обработки строк unicode (не нужно делать натурализацию).

Ответ 1

Хорошая, легкая библиотека, которую я использую успешно, utf8proc.

Ответ 3

UTF-8 специально разработан так, что многие байт-ориентированные строковые функции продолжают работать или нуждаются только в незначительных модификациях.

C strstr, например, будет работать отлично, если оба входа являются допустимыми, строки UTF-8 с нулевым завершением. strcpy работает отлично, пока его входная строка начинается с границы символа (например, возвращаемое значение strstr).

Таким образом, вам может даже не понадобиться отдельная библиотека!