Проблема заключается в том, что, как вы знаете, в диаграмме Unicode есть тысячи символов и я хочу преобразовать все похожие символы в буквы, которые находятся на английском алфавите.
Например, несколько преобразований:
ҥ->H
Ѷ->V
Ȳ->Y
Ǭ->O
Ƈ->C
tђє Ŧค๓เℓy --> the Family
...
и я увидел, что существует более 20 версий буквы A/a. и я не знаю, как их классифицировать. Они выглядят как иголки в стоге сена.
Полный список символов unicode находится в http://www.ssec.wisc.edu/~tomw/java/unicode.html или http://unicode.org/charts/charindex.html. Просто попробуйте прокрутить вниз и увидеть варианты букв.
Как я могу преобразовать все это с помощью Java? Пожалуйста, помогите мне: (