Если в заголовке Content-Type не указан параметр charset, RFC2616 раздел 3.7.1, как представляется, подразумевается, что ISO8859-1 следует принять за типы мультимедиа подтипа "текст":
Если не указан явный параметр charset предоставленные отправителем, подтипы СМИ типа "text" определены как имеющие значение кодировки по умолчанию для "ISO-8859-1" при получении через HTTP.
Данные в наборах символов, отличных от "ISO-8859-1" или его подмножества ДОЛЖНЫ быть помечены соответствующей кодировкой значение.
Тем не менее, я регулярно вижу приложения, которые обслуживают файлы Javascript со значениями Content-Type, такими как "application/x-javascript" (т.е. параметр charset), даже если эти скрипты содержат символы, отличные от ASCII UTF-8, которые будут поврежден, если он интерпретируется как ISO8859-1.
Это не создает проблем для клиентов. Как клиенты знают, как интерпретировать байты как UTF-8? Есть ли правило для других подтипов данных символов, которое подразумевает, что UTF-8 должен быть по умолчанию? Где это документировано?