Мне нужно обработать этот сценарий в Java:
Я получаю запрос в форме XML от клиента с объявленной кодировкой = utf-8. К сожалению, он может содержать не символы utf-8, и есть требование удалить эти символы из xml на моей стороне (legacy).
Рассмотрим пример, когда этот недопустимый XML содержит £ (фунт).
1) Я получаю xml как java String с E в нем (у меня нет доступа к интерфейсу прямо сейчас, но я, вероятно, получаю xml как строку java). Могу ли я использовать replaceAll (£, ""), чтобы избавиться от этого персонажа? Любые потенциальные проблемы?
2) Я получаю xml как массив байтов - как безопасно обрабатывать эту операцию в этом случае?