Что делает хорошую тестовую строку для тестирования веб-форм для совместимости с Юникодом?

Какой тестовый текст вы попробуете и введите в свои веб-формы, чтобы проверить, что они обрабатывают все случаи краев должным образом (особенно проблемы с Unicode и XSS).

Мне особенно интересны хорошие строки Unicode, которые могут делать что-то нечетное, если они ошибочно кодируются, когда они снова отображаются.

Текст, содержащий потенциально проблематичные символы, например, цитаты, <, > и т.д. также будет интересен.

Ответ 1

Ваша идея символов, чувствительных к HTML, - хорошее начало. Мне также нравится использовать символы, которые являются читабельными, но все еще Unicode. Когда я делал такое тестирование для tabblo.com, я использовал эту строку:

Testing «ταБЬℓσ»: 1<2 & 4+1>3, now 20% off!

У этого есть HTML-чувствительные символы, ASCII, верхние символы ISO и многобайтовые символы Юникода.

Ответ 2

Тестирование в Турции!

http://www.moserware.com/2008/02/does-your-code-pass-turkey-test.html

Это действительно довольно продвинутое тестирование интернационализации, а не слабое сердце, включая форматирование даты, процентные вычисления, переводы в верхнем/нижнем регистре и т.д.

Ответ 4

Ну, это немного грубый подход, но если вы хотите начать с какого-то хорошо сформированного Юникода и добавить некоторые ошибки, здесь есть большие ресурсы для реальных вещей: http://www.unicode.org/charts.