Я читал этот вопрос о том, как анализировать URL-адреса на веб-страницах и имел вопрос о принятом ответе , который предложил это решение:
((mailto\:|(news|(ht|f)tp(s?))\://){1}\S+)
Решение было предложено csmba, и он присвоил его regexlib.com. Уф. Сделанные кредиты.
Я думаю, что это довольно наивное регулярное выражение, но это прекрасная отправная точка для создания чего-то лучшего. Но, мой вопрос таков:
В чем смысл {1}
? Это означает "точно одну из предыдущих группировок", верно? Разве это не поведение по умолчанию для группировки в регулярном выражении? Не изменилось бы выражение, если бы {1}
были удалены?
Если бы я увидел это от коллеги, я бы указал на его или ее ошибку, но, как я пишу, ответ оценивается в 6, а выражение на regexlib.com оценивается в 4 из 5. Так что, возможно, я отсутствую что-то?