Вопросы кодирования относятся к одной теме, которая укусила меня чаще всего во время разработки. Каждая платформа настаивает на своей собственной кодировке, скорее всего, в игре есть не-UTF-8 по умолчанию. (Обычно я работаю над Linux, не выполнив UTF-8, мои коллеги в основном работают на немецких Windows, по умолчанию соответствуют ISO-8859-1 или какой-то подобной кодовой странице Windows)
Я считаю, что UTF-8 является подходящим стандартом для разработки приложения i18nable. Однако, по моему опыту, ошибки кодирования обычно обнаруживаются поздно (хотя я и находился в Германии, и у нас есть специальные символы, которые вместе с ISO-8859-1 предоставляют некоторые обнаруживаемые различия).
Я считаю, что разработчики с полностью не-ASCII-символьным набором (или те, которые знают язык, который использует такой набор символов) получают начало в предоставлении тестовых данных. Но должен быть способ облегчить это и для всех нас.
Какие [методы | инструмент | стимул] используются здесь людьми? Как вы можете заставить своих со-разработчиков заботиться об этих проблемах? Как вы проверяете соответствие? Эти тесты проводятся вручную или автоматически?
Добавление одного возможного аванса ответа:
Недавно я обнаружил fliptitle.com (они предоставляют простой способ получить странные символы, написанные "uʍop ǝpısdn" *), и я планируя использовать их для обеспечения легко проверяемых строк символов UTF-8 (так как большинство символов, используемых там, находятся в какой-то странной позиции двоичного кодирования), но, безусловно, должны быть более систематические тесты, шаблоны или методы для обеспечения совместимости UTF-8/использование.
Примечание. Несмотря на то, что есть принятый ответ, я хотел бы узнать больше методов и шаблонов, если они есть. Если у вас больше идей, добавьте больше ответов. И было нелегко выбрать только один ответ для принятия. Я выбрал regexp-ответ для наименее ожидаемого угла, чтобы решить проблему, хотя были бы причины выбирать и другие ответы. Жаль, что может быть принят только один ответ.
Спасибо за ваш вклад.
*), что "вверх тормашками" написано "вверх ногами" для тех, кто не может видеть эти символы из-за проблем с шрифтом.