У меня есть приложение, которое (как и многие другие) принимает вход пользователя, сохраняет его в базе данных, а затем обрабатывает его, используя (среди прочего) инструменты XML. Приложение принимает бесплатный ввод текста и, как и многие другие разработчики, я очень осторожен с экранированием и цитированием, чтобы он мог обрабатывать ввод, содержащий разные типы пробелов, символы кавычек, зарезервированные символы XML и т.д.
Однако иногда пользователю удаётся вводить строку, содержащую вертикальный символ табуляции (hex 0B) или фид формы (hex 0C). это невозможно обработать инструментами XML вообще и вызывает приложение barf.
В моем приложении очень важно сохранить исходный ввод во время процесса "туда и обратно", поэтому я не хочу просто выделять любые персонажи, которые мне не нравятся, особенно такие вещи, как фид-фид, которые по-прежнему иногда используются в текстовые файлы.
есть ли принятая передовая практика или общая стратегия для обработки этих символов при обработке XML?