Какие символы НЕ присутствуют в Юникоде?

Я слышал, что некоторые символы не присутствуют в стандарте Unicode, несмотря на то, что они записаны в повседневной жизни популяциями некоторых областей. Особенно я слышал о недавних китайских именах, сфабрикованных путем сборки существующих частей персонажей, но я не могу найти никаких ссылок для этого.

Например, персонаж ниже очень распространен для 50 миллионов человек, но он не в Юникоде:

enter image description here

Есть ли список таких символов? (изображения или веб-сайт, в котором перечислены такие символы, как изображения)

Ответ 2

Ну, в Unicode есть множество вещей (хотя новые символы все еще добавляются).

Некоторые примеры:

  • Благодаря Han Unification, Unicode использует один код для нескольких похожих символов с разных языков. Люди не согласны, действительно ли эти персонажи "одинаковы"; если вы считаете, что они должны быть представлены отдельно, то эти отдельные представления можно назвать "отсутствующими" (хотя это что-то вроде философского вопроса).
  • В подобном ключе многие языки (особенно азиатские языки) иногда имеют несколько вариантов одного символа/глифа. Различие между "одним персонажем с несколькими представлениями" (= одним кодовым пунктом) и "отдельными символами" (= разными кодовыми точками) является несколько арбитражным, поэтому есть случаи (например, с символами кандзи), где некоторые люди считают, что альтернативные варианты "отсутствуют".
  • Многие исторические и редко используемые персонажи отсутствуют.
  • Многие старые/исторические сценарии не охватываются, например. Линейный A

Ответ 4

Есть тонны символов из символьной части стандарта, которые досадно не включены.

Смотрите раздел "Отсутствующие симметричные версии" http://xahlee.org/comp/unicode_arrows.html для кучки символов стрелок, которые существуют, но только в определенных направлениях. Некоторые просто глупы. Например, есть ⥂, ⥃ и ⥄, но нет верной версии последней версии.

И вы можете видеть из http://en.wikipedia.org/wiki/Unicode_subscripts_and_superscripts, что они случайно выбрали буквы, которые будут поддерживаться в форме super и sub script. Например, они включают в себя нижеследующие гласные a, e, o и даже schwa (ə), но не i, что было бы очень полезно, поскольку это общий индекс в математическом наборе. Взгляните на статью в Википедии для получения более подробной информации (вам понадобится установленный шрифт Юникода, потому что по крайней мере на момент написания они регулярные эквиваленты ascii явно не перечислены), но в основном они выбрали примерно половину латинского алфавита, казалось бы, случайным образом для каждого из символов верхнего и нижнего регистра супер- и суб-script.

Кроме того, большого количества символов, которые были бы удобны для построения фигур с помощью unicode, не существует.

Ответ 5

Естественно, что Unicode не может догнать некоторые новые идеографические символы или некоторые редко используемые символы.

Но я не могу понять причины этого вопроса. Вы можете нарисовать любой случайный символ, который вы хотите, он, скорее всего, не будет стандартным символом Юникода.

Или это просто любопытство?