В 2010 году вы будете показывать URL-адреса, содержащие символы UTF-8 на большом веб-портале?
Символы Unicode запрещены в соответствии с RFC по URL-адресам (см. здесь). Они должны быть закодированы в процентах, чтобы соответствовать стандартам.
Мое главное, однако, обслуживать незарегистрированные символы с единственной целью - иметь красивые URL-адреса, поэтому процентная кодировка отсутствует.
Все основные браузеры, похоже, анализируют эти URL-адреса, независимо от того, что говорит RFC. Мое общее впечатление, однако, в том, что он становится очень шатким при выходе из домена веб-браузеров:
- URL-адреса, получающие копию + вставляемые в текстовые файлы, электронные письма, даже веб-сайты с другим кодированием
- Библиотеки HTTP-клиента
- Экзотические браузеры, читатели RSS
Насколько я уверен, что здесь можно ожидать неприятностей, и, следовательно, это не практическое решение (пока), если вы обслуживаете нетехническую аудиторию, и важно, чтобы все ваши ссылки работали правильно, даже если они цитировались и передавались
Есть ли какой-то волшебный способ обслуживания симпатичных URL-адресов в HTML
http://www.example.com/düsseldorf?neighbourhood=Lörick
который может быть скопирован + вставлен с особыми символами неповрежденными, но корректно работать при повторном использовании у более старых клиентов?