Как мне сопоставить строку с регулярным выражением в Bash?

Я пытаюсь написать bash script, который содержит функцию, поэтому при задании файла .tar, .tar.bz2, .tar.gz и т.д. он использует tar с соответствующими переключателями для распаковки файла.

Я использую if elif, затем инструкции, которые проверяют имя файла, чтобы увидеть, с чем он заканчивается, и я не могу заставить его соответствовать метасимволам регулярных выражений.

Чтобы сохранить постоянное переписывание script, я использую "тест" в командной строке, я думал, что приведенное ниже утверждение должно работать, я пробовал каждую комбинацию скобок, кавычек и метаматератов, и все равно это не удается.

test sed-4.2.2.tar.bz2 = tar\.bz2$; echo $?
(this returns 1, false)

Я уверен, что проблема проста, и я везде искал, но я не могу понять, как это сделать. Кто-нибудь знает, как я могу это сделать?

Ответ 1

Чтобы соответствовать регулярным выражениям, вам нужно использовать оператор =~.

Попробуйте следующее:

[[ sed-4.2.2.tar.bz2 =~ tar.bz2$ ]] && echo matched

В качестве альтернативы вы можете использовать подстановочные знаки (вместо регулярных выражений) с помощью оператора ==:

[[ sed-4.2.2.tar.bz2 == *tar.bz2 ]] && echo matched

Если переносимость не вызывает беспокойства, я рекомендую использовать [[ вместо [ или test, поскольку он более безопасен и более мощный. См. В чем разница между тестом, [и [[? для деталей.

Ответ 2

Функция для этого

extract () {
  if [ -f $1 ] ; then
      case $1 in
          *.tar.bz2)   tar xvjf $1    ;;
          *.tar.gz)    tar xvzf $1    ;;
          *.bz2)       bunzip2 $1     ;;
          *.rar)       rar x $1       ;;
          *.gz)        gunzip $1      ;;
          *.tar)       tar xvf $1     ;;
          *.tbz2)      tar xvjf $1    ;;
          *.tgz)       tar xvzf $1    ;;
          *.zip)       unzip $1       ;;
          *.Z)         uncompress $1  ;;
          *.7z)        7z x $1        ;;
          *)           echo "don't know '$1'..." ;;
      esac
  else
      echo "'$1' is not a valid file!"
  fi
}

Прочее Примечание

В ответ на силу Водолея в комментарии выше, We need to store the regex on a var

Переменная BASH_REMATCH устанавливается после соответствия выражению, а ${BASH_REMATCH [n]} будет соответствовать n-й группе, заключенной в круглые скобки, то есть в следующих ${BASH_REMATCH[1]} = "compressed" и ${BASH_REMATCH[2]} = ".gz"

if [[ "compressed.gz" =~ ^(.*)(\.[a-z]{1,5})$ ]]; 
then 
  echo ${BASH_REMATCH[2]} ; 
else 
  echo "Not proper format"; 
fi

(Регулярное выражение выше не должно быть допустимым для имен файлов и расширений, но оно работает для примера)

Ответ 3

У меня недостаточно представителей, чтобы комментировать, поэтому я отправляю новый ответ, чтобы улучшить ответ на собачьей упряжке. Точка в регулярном выражении

[[ sed-4.2.2.tar.bz2 =~ tar.bz2$ ]] && echo matched

будет фактически соответствовать любому символу, а не только буквальной точке между tar.bz2, например

[[ sed-4.2.2.tar4bz2 =~ tar.bz2$ ]] && echo matched
[[ sed-4.2.2.tar§bz2 =~ tar.bz2$ ]] && echo matched

или что-нибудь, что не требует экранирования с \. Строгий синтаксис должен быть

[[ sed-4.2.2.tar.bz2 =~ tar\.bz2$ ]] && echo matched

или вы можете пойти еще строже и также включить предыдущую точку в регулярное выражение:

[[ sed-4.2.2.tar.bz2 =~ \.tar\.bz2$ ]] && echo matched

Ответ 4

Поскольку вы используете bash, вам не нужно создавать дочерний процесс для этого. Вот одно решение, которое выполняет это полностью в bash:

[[ $TEST =~ ^(.*):\ +(.*)$ ]] && TEST=${BASH_REMATCH[1]}:${BASH_REMATCH[2]}

Объяснение: Группы до и после последовательности "двоеточие и один или несколько пробелов" сохраняются оператором сопоставления с образцом в массиве BASH_REMATCH.

Ответ 5

shopt -s nocasematch

if [[ sed-4.2.2.$LINE =~ (yes|y)$ ]]
 then exit 0 
fi

Ответ 6

if [[ $STR == *pattern* ]]
then
    echo "It is the string!"
else
    echo "It not him!"
fi

Работает для меня! GNU bash, version 4.3.11(1)-release (x86_64-pc-linux-gnu)