Я пытаюсь сделать акцентированную замену символов на PHP, но получаю фанковые результаты, полагаю, потому, что я использую строку UTF-8, а str_replace не может правильно обрабатывать многобайтовые строки.
$accents_search = array('á','à','â','ã','ª','ä','å','Á','À','Â','Ã','Ä','é','è',
'ê','ë','É','È','Ê','Ë','í','ì','î','ï','Í','Ì','Î','Ï','œ','ò','ó','ô','õ','º','ø',
'Ø','Ó','Ò','Ô','Õ','ú','ù','û','Ú','Ù','Û','ç','Ç','Ñ','ñ');
$accents_replace = array('a','a','a','a','a','a','a','A','A','A','A','A','e','e',
'e','e','E','E','E','E','i','i','i','i','I','I','I','I','oe','o','o','o','o','o','o',
'O','O','O','O','O','u','u','u','U','U','U','c','C','N','n');
$str = str_replace($accents_search, $accents_replace, $str);
Результаты, которые я получаю:
Ørjan Nilsen -> �orjan Nilsen
Ожидаемый результат:
Ørjan Nilsen -> Orjan Nilsen
Изменить: у меня есть обработчик внутренних символов, установленный в UTF-8 (в соответствии с mb_internal_encoding()), также значение $str является UTF-8, поэтому из того, что я могу сказать, все используемые строки - UTF -8. Определяет ли str_replace() определение char и использует их правильно?