Регулярное выражение IPv6 (RegEx) не работает в PL/SQL

Я не могу понять, почему это регулярное выражение не работает в PL/SQL.

if ( REGEXP_LIKE(v,'/^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$/iD') ) then

Для проверки IPv4 и IPv6 он пришел сюда: qaru.site/info/19824/...

Не уверен, что это имеет к этому какое-то отношение, но я также задал этот вопрос о знаке D в конце: Что такое регулярное выражение (RegEx) Ид

По какой-то причине это регулярное выражение работает для большинства моих тестов на этом сайте: http://regex101.com/, но в PL/SQL все недействительно.

Что я имею в виду под most, так это то, что есть некоторые случаи, когда я нахожу, что он терпит неудачу, но я искал дни, и это лучший из них, который я могу найти под 512 символами ( 512 является предел при использовании REGEXP_LIKE в PL/SQL)

Буду признателен за любую помощь. Спасибо!

Это те тесты, которые я использую...

{1: Initial address, regex should say valid/match}
select isValid('2001:0db8:0000:0000:0000:ff00:0042:8329','ipv6') from dual;

{2: After removing all leading zeroes, regex should say valid/match}
select isValid('2001:db8:0:0:0:ff00:42:8329','ipv6') from dual;

{3: After omitting consecutive sections of zeroes, regex should say valid/match}
select isValid('2001:db8::ff00:42:8329','ipv6') from dual;

{4: The loopback address, regex should say valid/match}
select isValid('0000:0000:0000:0000:0000:0000:0000:0001','ipv6') from dual;

{5: The loopback address be abbreviated to ::1 by using both rules, regex should say valid/match}
select isValid('::1','ipv6') from dual;

{6: This should be valid/match}
select isValid('ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:192.168.158.190','ipv6') from dual;

{7: This should be valid/match}
select isValid('::','ipv6') from dual;

{8: IPv6 applications to communicate directly with IPv4 applications, regex should say valid/match}
select isValid('0:0:0:0:0:ffff:192.1.56.10','ipv6') from dual;

{9: should NOT be valid/match}
select isValid('::ffff:192.1.56.10/96','ipv6') from dual;

{old formats used for tunneling, these should NOT be valid/matches}
{10}
select isValid('0:0:0:0:0:0:192.1.56.10','ipv6') from dual;
{11}
select isValid('::192.1.56.10/96','ipv6') from dual;

{These 4 should be valid/match}
{12}
select isValid('::FFFF:129.144.52.38','ipv6') from dual;
{13}
select isValid('::129.144.52.38','ipv6') from dual;
{14}
select isValid('::FFFF:d','ipv6') from dual;
{15}
select isValid('1080:0:0:0:8:800:200C:417A','ipv6') from dual;

{These 4 should NOT be valid/match}
{16}
select isValid('::FFFF:d.d.d','ipv6') from dual;
{17}
select isValid('::FFFF:d.d','ipv6') from dual;
{18}
select isValid('::d.d.d','ipv6') from dual;
{19}
select isValid('::d.d','ipv6') from dual;

Мне сказали, что тест №6 был неправильным, ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:192.168.158.190 не является допустимым адресом IPv6, это правильно?

Тестовые примеры 8-11 пришли отсюда: http://publib.boulder.ibm.com/infocenter/iseries/v5r3/index.jsp?topic=%2Frzai2%2Frzai2ipv6addrformat.htm, но мне сказали, что 10 и 11 больше не используются.

Ответ 1

Вместо того, чтобы делать все в одном регулярном выражении, лучше разбить регулярное выражение на более мелкие и проверить их:

if (
    /* IPv6 expanded */
    REGEX_LIKE(v, '\A[a-f0-9]{1,4}(:[a-f0-9]{1,4}){7}\z', 'i')
    /* IPv6 shorthand */
    OR (NOT REGEX_LIKE(v, '\A(.*?[a-f0-9](:|\z)){8}', 'i')
        AND REGEX_LIKE(v, '\A([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,6})?::([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,6})?\z', 'i'))
    /* IPv6 dotted-quad notation, expanded */
    OR REGEX_LIKE(v, '\A[a-f0-9]{1,4}(:[a-f0-9]{1,4}){5}:(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}\z', 'i')
    /* IPv6 dotted-quad notation, shorthand */
    OR (NOT REGEX_LIKE(v, '\A(.*?[a-f0-9]:){6}', 'i')
        AND REGEX_LIKE(v, '\A([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,4})?::([a-f0-9]{1,4}:){0,5}(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}\z', 'i'))
   ) then

Это только тесты для IPv6. IPv4 не разрешен.

Так как аромат PL/SQL не имеет вызовов подпрограмм (?n), выбора нет, кроме как развернуть все. И отсутствие негативного внешнего вида (?!pattern) заставляет нас имитировать его с помощью двух операций тестирования регулярных выражений.

\A и \z используются для сопоставления начала и конца строки, поскольку на обоих из них не влияют флаги, а поведение \z такое же, как $ в режиме D в PCRE.

Ответ 2

Вам нужно избавиться от/в начале и /iD с конца, это часть синтаксиса perl, указывающая, что это регулярное выражение.

ключ я в конце означает игнорировать регистр и может быть задан как дополнительный аргумент вашего regexp_like, поэтому:

if ( REGEXP_LIKE(v,'^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$','i') ) the

Есть больше проблем, так как регулярные выражения perl не эквивалентны 100% эквивалентным регулярным выражениям oracle, и я вижу, что используемые здесь тестеры недоступны как? > Возможно, вы можете разделить регулярное выражение между ipv4 и ipv6, чтобы избежать попадания в оракул. И просто сделайте REGEXP_LIKE (ip, 'ipv4pattern') или REGEXP_LIKE (ip, 'ipv6pattern')

Настройка части ipv4 вышеуказанного регулярного выражения на то, что работает в oracle, дает мне:

REGEXP_LIKE(ip,'^((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])\.){3}(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])$','i')

Ответ 3

REGEXP_LIKE(ip,'^(([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:[\dA-F]{0,4}|:[\dA-F]{1,4})?|(:[\dA-F]{1,4}){0,2})|(:[\dA-F]{1,4}){0,3})|(:[\dA-F]{1,4}){0,4})|:(:[\dA-F]{1,4}){0,5})((:[\dA-F]{1,4}){2}|:(25[0-5]|(2[0-4]|1\d|[1-9])?\d)(\.(25[0-5]|(2[0-4]|1\d|[1-9])?\d)){3})|(([\dA-F]{1,4}:){1,6}|:):[\dA-F]{0,4}|([\dA-F]{1,4}:){7}:)\z', 'i')

Изменено из регулярного выражения XML в http://home.deds.nl/~aeron/regex/