Для макетирования у нас есть наш знаменитый текст "Lorem ipsum", чтобы проверить, как он выглядит.
Я ищу набор файлов, содержащих текст, закодированный с несколькими различными кодировками, которые я могу использовать в своих тестах JUnit для тестирования некоторых методов, которые имеют дело с кодировкой символов при чтении текстовых файлов.
Пример:Наличие ISO 8859-1
закодированного тестового файла и Windows-1252
закодированного тестового файла. Windows-1252 должен инициировать различия в области 80 16 - 9F 16. Другими словами, он должен содержать по крайней мере один символ этой области, чтобы отличить его от ISO 8859-1.
Возможно, лучший набор тестовых файлов - это то, где тестовый файл для каждой кодировки содержит все свои символы один раз. Но, может быть, я не знаю, что это такое?: -)
Есть ли такой набор тестовых файлов для проблем с кодировкой символов?