Чтобы дать вам очень простой и плохой пример. Данные разделяются на 4 бита. 16 возможных номеров соответствуют первым 16 согласным. Вы добавляете случайный гласный, чтобы сделать его произносимым. Так что "08F734F7" может стать "ba lo ta ku fo go ta ka". Вы можете присоединиться к некоторым слогам и добавить знаки препинания и капитализации, и это может стать "Бало та куфого, Така"? который выглядит как правдоподобный язык.
Просто, чтобы все было ясно, я не пытаюсь защитить двоичные данные.
Я хочу использовать это после сжатия и шифрования обычного (UTF-8) обычного текстового дневника. Получающиеся двоичные данные должны выглядеть довольно случайными. Мне нужно преобразовать эти данные в правдоподобный язык и иметь возможность вернуть его обратно. Я собираюсь напечатать "язык" на бумаге и сделать собственную книгу.
Итак, я ищу лучший метод преобразования случайных данных в читаемые правдоподобные слова. По хорошему я имею в виду отношение наибольших бит к письмам (при этом он выглядит как настоящий язык). В моем примере это ровно 2 бита на букву. Или 4 буквы для байта.