Я делаю удаление HTML с использованием регулярных выражений (да, я знаю, никогда не анализируйте HTML с регулярными выражениями, но я просто снимаю его, а также, к сожалению, не могу использовать какие-либо внешние библиотеки). Я использую регулярное выражение из Cookbook Regular Expressions, и он отлично поработал, но я просто столкнулся с этой проблемой:
В строке Bob Saget <[email protected]>
мое регулярное выражение соответствует электронной почте как тег.
Итак, мой вопрос в том, является ли знак @
допустимым символом XML или HTML тегом? (Я не спрашиваю, действительно ли это в атрибуте, я знаю, что это так) Если это не так, я смогу успешно исключить его в своем регулярном выражении.
Я не уверен, где это посмотреть. Я посмотрел здесь, и я думаю, что это говорит о том, что в XML знак at не допускается в теге; однако, я был бы признателен за конкретное доказательство.