Мой вопрос довольно прост, но озадачен. Может быть, есть простой переключатель, который исправляет это, но я не очень много разбираюсь в регулярных выражениях Java...
String line = "💕💕💕";
line.replaceAll("(?i)(.)\\1{2,}", "$1");
Сбой. Если я удалю переключатель (?i)
, он будет работать. Три символа unicode не являются случайными, они были найдены среди большого корейского текста, но я не знаю, что они действительны или нет.
Странно то, что регулярное выражение работает для всего другого текста, кроме этого. Почему я получаю сообщение об ошибке?
Это исключение, которое я получаю
Exception in thread "main" java.lang.StringIndexOutOfBoundsException: String index out of range: 6
at java.lang.String.charAt(String.java:658)
at java.lang.Character.codePointAt(Character.java:4668)
at java.util.regex.Pattern$CIBackRef.match(Pattern.java:4846)
at java.util.regex.Pattern$Curly.match(Pattern.java:4125)
at java.util.regex.Pattern$GroupTail.match(Pattern.java:4615)
at java.util.regex.Pattern$CharProperty.match(Pattern.java:3694)
at java.util.regex.Pattern$GroupHead.match(Pattern.java:4556)
at java.util.regex.Pattern$Start.match(Pattern.java:3408)
at java.util.regex.Matcher.search(Matcher.java:1199)
at java.util.regex.Matcher.find(Matcher.java:592)
at java.util.regex.Matcher.replaceAll(Matcher.java:902)
at java.lang.String.replaceAll(String.java:2162)
at tokenizer.Test.main(Test.java:51)