Регулярное выражение для нахождения точек разделителя в формуле

Библиотека выражения С#, которую я использую, напрямую не поддерживает синтаксис параметра таблицы/поля:

Ниже приведены имена параметров таблицы/поля, которые не поддерживаются напрямую:

TableName1.FieldName1
[TableName1].[FieldName1]
[Table Name 1].[Field Name 1]

Он принимает буквенно-цифровые параметры без пробелов или большинство символов, заключенных в квадратные скобки. Я хотел бы использовать регулярные выражения С# для замены разделителей точек и соседних скобок на другой разделитель, поэтому результаты будут следующими:

[TableName1|FieldName1]
[TableName1|FieldName1]
[Table Name 1|Field Name 1]

Мне также нужно пропустить любые строковые литералы в одинарных кавычках, например:

'TableName1.FieldName1'

И, конечно, игнорировать любые числовые литералы вроде:

12345.6789

РЕДАКТИРОВАТЬ: Благодарим вас за отзыв по улучшению моего вопроса. Надеюсь, теперь это понятно.

Ответ 1

Я написал совершенно новый ответ, теперь, когда проблема выясняется:

Вы можете сделать это в одном регулярном выражении. Я думаю, это довольно пуленепробиваемый, но, как вы видите, это не совсем понятно, поэтому я прокомментировал это либерально. Надеюсь, что это имеет смысл.

Вам повезло, что .NET позволяет повторно использовать именованные группы захвата, иначе вам пришлось бы сделать это за несколько шагов.

resultString = Regex.Replace(subjectString, 
    @"(?:             # Either match...
     (?<before>       #  (and capture into backref <before>)
      (?=\w*\p{L})    #  (as long as it contains at least one letter):
      \w+             #  one or more alphanumeric characters,
     )                #  (End of capturing group <before>).
     \.               #  then a literal dot,
     (?<after>        #  (now capture again, into backref <after>)
      (?=\w*\p{L})    #  (as long as it contains at least one letter):
      \w+             #  one or more alphanumeric characters.
     )                #  (End of capturing group <after>) and end of match.
    |                 # Or:
     \[               #  Match a literal [
     (?<before>       #  (now capture into backref <before>)
      [^\]]+          #  one or more characters except ]
     )                #  (End of capturing group <before>).
     \]\.\[           #  Match literal ].[
     (?<after>        #  (capture into backref <after>)
      [^\]]+          #  one or more characters except ]
     )                #  (End of capturing group <after>).
     \]               #  Match a literal ]
    )                 # End of alternation. The match is now finished, but
    (?=               # only if the rest of the line matches either...
     [^']*$           #  only non-quote characters
     |                # or
     [^']*'[^']*'     #  contains an even number of quote characters
     [^']*            #  plus any number of non-quote characters
     $                #  until the end of the line.
    )                 # End of the lookahead assertion.", 
    "[${before}|${after}]", RegexOptions.Multiline | RegexOptions.IgnorePatternWhitespace);

Ответ 2

надеюсь, что вы можете попробовать это регулярное выражение: /(\w[0-9]* *)+/g это отфильтровывает все буквенно-цифровые символы, за исключением.