Каков наилучший способ получить список всех файлов в каталоге, отсортированный по дате [created | изменено], используя python, на машине Windows?
Как получить список каталогов, отсортированный по дате создания в python?
Ответ 1
Здесь приведен более подробный вариант ответа @Greg Hewgill
. Это наиболее соответствует требованиям к вопросу. Он проводит различие между датами создания и модификации (по крайней мере, в Windows).
#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time
# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'
# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)
# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date
# but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date
for cdate, path in sorted(entries):
print time.ctime(cdate), os.path.basename(path)
Пример:
$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py
Ответ 2
В прошлом я делал это для скрипта Python, чтобы определить последние обновленные файлы в каталоге:
import glob
import os
search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list
# of files (presumably not including directories)
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))
Это должно делать то, что вы ищете, основываясь на файле mtime.
РЕДАКТИРОВАТЬ: обратите внимание, что вы также можете использовать os.listdir() вместо glob.glob() при желании - причина, по которой я использовал glob в своем исходном коде, заключалась в том, что я хотел использовать glob для поиска только файлов с определенный набор расширений файлов, для которого лучше подходит glob(). Чтобы использовать listdir, вот как это будет выглядеть:
import os
search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))
Ответ 3
Существует функция os.path.getmtime
которая дает количество секунд с начала эпохи и должна быть быстрее, чем os.stat
.
import os
os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)
Ответ 4
Здесь моя версия:
def getfiles(dirpath):
a = [s for s in os.listdir(dirpath)
if os.path.isfile(os.path.join(dirpath, s))]
a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
return a
Сначала мы создаем список имен файлов. isfile() используется для пропуска каталогов; его можно опустить, если каталоги должны быть включены. Затем мы сортируем список на месте, используя дату изменения в качестве ключа.
Ответ 5
Здесь однострочный:
import os
import time
from pprint import pprint
pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])
Это вызывает os.listdir(), чтобы получить список имен файлов, затем вызывает os.stat() для каждого, чтобы получить время создания, а затем сортирует его со временем создания.
Обратите внимание, что этот метод только один раз вызывает os.stat() для каждого файла, что будет более эффективным, чем вызов его для каждого сравнения в сортировке.
Ответ 6
Без изменения каталога:
import os
path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)
print time_sorted_list
# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list
Ответ 7
Здесь мой ответ, используя glob без фильтра, если вы хотите читать файлы с определенным расширением в порядке дат (Python 3).
dataset_path='/mydir/'
files = glob.glob(dataset_path+"/morepath/*.extension")
files.sort(key=os.path.getmtime)
Ответ 8
В python 3.5 +
from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)
Ответ 9
sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.stat(p).st_mtime)
Вы можете использовать os.walk('.').next()[-1]
вместо фильтрации с помощью os.path.isfile
, но это оставляет мертвые символические ссылки в списке, а os.stat
терпит неудачу.
Ответ 10
Это основной шаг для изучения:
import os, stat, sys
import time
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'
listdir = os.listdir(dirpath)
for i in listdir:
os.chdir(dirpath)
data_001 = os.path.realpath(i)
listdir_stat1 = os.stat(data_001)
listdir_stat2 = ((os.stat(data_001), data_001))
print time.ctime(listdir_stat1.st_ctime), data_001
Ответ 11
Ответ Alex Coventry приведет к возникновению исключения, если файл является символической ссылкой на неисследованный файл, следующий код исправляет этот ответ:
import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())
Когда файл не существует, используется функция now(), и символическая ссылка будет идти в самом конце списка.
Ответ 12
# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time
import glob,os
lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))
Ответ 13
Вот простая пара строк, которая ищет расширение, а также предоставляет возможность сортировки
def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False):
files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({})$'.format(regex_ext), f)]
files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
return files_to_evaluate
Ответ 14
Для полноты с os.scandir
(в 2 раза быстрее, чем pathlib
):
import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)
Ответ 15
Возможно, вы должны использовать команды оболочки. В Unix/Linux поиск со списком каналов, возможно, будет способен делать то, что вы хотите.