Мы тестируем наше приложение для совместимости с Unicode и выбираем случайные символы за пределами латинского набора символов для тестирования.
В обеих латинских и японских системах справедливо следующее равенство (U + 3422):
N'㐢㐢㐢㐢' = N'㐢㐢㐢'
но следующее не (U + 30C1):
N'チチチチ' = N'チチチ'
Это было обнаружено, когда тестовый пример с использованием первого примера (с использованием U + 3422) нарушил уникальный индекс. Нужно ли быть более избирательным в отношении символов, которые мы используем для тестирования? Очевидно, мы не знаем семантического значения вышеупомянутых сравнений. Было ли это поведение очевидным для носителей языка?