Одна из опрятных характеристик UTF-8 состоит в том, что если вы сравниваете две строки (с <) побайтно, вы получаете тот же ответ, как если бы вы сравнивали их по кодовым точкам. Мне было интересно, была ли подобная кодировка оптимальной по размеру (например, UTF-8 "отнимает" пространство, помещая байты в 10xxxxxx, если они не являются первым байтом, представляющим кодовую точку).
Предположение об оптимальности здесь состоит в том, что неотрицательное число n является более частым, чем число m, если n < м.
Мне больше всего интересно узнать, существует ли (байтовая сопоставимая) кодировка, которая работает для целых чисел, причем n чаще, чем m, если | n | < | М |.