У меня есть следующие имена файлов, которые показывают этот шаблон:
000014_L_20111007T084734-20111008T023142.txt
000014_U_20111007T084734-20111008T023142.txt
...
Я хочу извлечь средние две метки времени после второго подчеркивания '_'
и до '.txt'
. Таким образом, я использовал следующее разделение строки регулярного выражения Python:
time_info = re.split('^[0-9]+_[LU]_|-|\.txt$', f)
Но это дает мне две лишние пустые строки в возвращаемом списке:
time_info=['', '20111007T084734', '20111008T023142', '']
Как получить только две метки времени? то есть я хочу:
time_info=['20111007T084734', '20111008T023142']