Программно определить количество штрихов в китайском иероглифе?

В Unicode хранится информация о количестве штрихов, относящихся к китайским, японским или другим символам на основе штриха?

Ответ 1

Небольшой googling придумал Unihan.zip, файл, опубликованный Unicode Consortium, который содержит несколько текстовых файлов, включая Unihan_RadicalStrokeCounts.txt, которые могут быть тем, что вы хотите. На основе этих данных также существует Unihan Database Lookup.

Ответ 2

В Python для этого есть библиотека:

>>> from cjklib.characterlookup import CharacterLookup
>>> cjk = CharacterLookup('C')
>>> cjk.getStrokeCount(u'日')
4

Отказ от ответственности: я написал его

Ответ 3

Вы имеете в виду, что он каким-то образом закодирован в фактической кодовой точке? Нет. Там может быть таблица где-нибудь, которую вы можете найти в сети (или создать ее), но она не является частью мандата Unicode для хранения таких метаданных.

Ответ 4

Если вы хотите использовать знаки распознавания символов HanziDict.

Также ознакомьтесь с сайтом данных Unihan:

http://www.unicode.org/charts/unihanrsindex.html

Вы можете посмотреть количество инсульта, а затем получить информацию о персонаже. Возможно, вы сможете создать собственный взгляд.