Возможный дубликат:
Javascript RegExp + границы Word + символы Unicode
В ECMA Script regex (проверено здесь для справки: http://regexpal.com/) Я получаю ложные срабатывания со слоями (используя \b
) и умлаут. Например
regex \bPflanzen\b
не должен соответствовать "Pflanzenöl", но это так. Если я изменил ö
на oe
, все будет работать. Regex, похоже, не считает умлауты частью слов, хотя они и есть на многих языках.
Какое лучшее обходное решение?