Разделение строки JavaScript на "символы" можно сделать тривиально, но есть проблемы, если вы заботитесь о Unicode (и вы должны заботиться о Unicode).
JavaScript изначально обрабатывает символы как 16-битные объекты (UCS-2 или UTF-16), но это не позволяет использовать символы Unicode вне BMP (базовая многоязычная плоскость).
Чтобы обрабатывать символы Unicode за пределами BMP, JavaScript должен учитывать "суррогатные пары", которые он не делает изначально.
Я ищу, как разбить строку js на код, независимо от того, требуется ли кодовым точкам один или два символа JavaScript (единицы кода).
В зависимости от ваших потребностей расщепление codepoint может быть недостаточно, и вы можете захотеть разделить на " grapheme cluster", где кластер является базовым кодом, за которым следуют все его кодовые точки с модификатором нераспределенного интервала, такие как сочетающий акценты и диакритические знаки.
Для целей этого вопроса мне не требуется разбиение кластером графем.