Так как MySQL utf8 не поддерживает 4 байтовых символа, я ищу способ обнаружения и устранения любых 4-байтовых символов utf8 из строки в Ruby. Я понимаю, что я могу обновить свою таблицу, чтобы использовать utf8m4, но по нескольким причинам, что невозможно или желаемое решение.
Простое кодирование строки в ASCII удалит эти символы, но также удалит все другие символы, отличные от ASCII, что не очень хорошо.