Как читать содержимое файла 7z с помощью python

Как я могу прочитать и сохранить содержимое 7z. Я использую Python 2.7.9, я могу извлечь или архивировать, как это, но я не могу читать содержимое в python, я перечисляю только содержимое файла в CMD

import subprocess
import os

source = 'filename.7z'
directory = 'C:\Directory'
pw = '123456'
subprocess.call(r'"C:\Program Files (x86)\7-Zip\7z.exe" x '+source +' -o'+directory+' -p'+pw)

Ответ 1

Вы можете использовать libarchive или pylzma. Если вы можете перейти на python3.3 +, вы можете использовать lzma, который находится в стандартной библиотеке.

Ответ 2

Я оказался в такой ситуации, когда мне пришлось использовать 7z, а также мне нужно было точно знать, какие файлы были извлечены из каждого zip-архива. Чтобы справиться с этим, вы можете проверить вывод вызова 7z и поискать имена файлов. Вот как выглядит вывод 7z:

$ 7z l sample.zip

7-Zip [64] 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21
p7zip Version 16.02 (locale=utf8,Utf16=on,HugeFiles=on,64 bits,8 CPUs x64)

Scanning the drive for archives:
1 file, 472 bytes (1 KiB)

Listing archive: sample.zip

--
Path = sample.zip
Type = zip
Physical Size = 472

   Date      Time    Attr         Size   Compressed  Name
------------------- ----- ------------ ------------  ------------------------
2018-12-01 17:09:59 .....            0            0  sample1.txt
2018-12-01 17:10:01 .....            0            0  sample2.txt
2018-12-01 17:10:03 .....            0            0  sample3.txt
------------------- ----- ------------ ------------  ------------------------
2018-12-01 17:10:03                  0            0  3 files

и как проанализировать этот вывод с помощью Python:

import subprocess

def find_header(split_line):
    return 'Name' in split_line and 'Date' in split_line

def all_hyphens(line):
    return set(line) == set('-')

def parse_lines(lines):
    found_header = False
    found_first_hyphens = False
    files = []
    for line in lines:

        # After the header is a row of hyphens
        # and the data ends with a row of hyphens
        if found_header:
            is_hyphen = all_hyphens(''.join(line.split()))

            if not found_first_hyphens:
                found_first_hyphens = True
                # now the data starts
                continue

            # Finding a second row of hyphens means we're done
            if found_first_hyphens and is_hyphen:
                return files

        split_line = line.split()

        # Check for the column headers
        if find_header(split_line):
            found_header=True
            continue

        if found_header and found_first_hyphens:
            files.append(split_line[-1])
            continue

    raise ValueError("We parsed this zipfile without finding a second row of hyphens")



byte_result=subprocess.check_output('7z l sample.zip', shell=True)
str_result = byte_result.decode('utf-8')
line_result = str_result.splitlines()
files = parse_lines(line_result)

Ответ 3

Обстрел и вызов 7z извлечет файлы, а затем вы можете open() эти файлы.

Если вы хотите заглянуть внутрь архива 7z непосредственно в Python, вам нужно использовать библиотеку. Вот один из них: https://pypi.python.org/pypi/libarchive - я не могу ручаться за это, как я сказал - я не пользователь Python - но использование сторонней библиотеки обычно довольно просто на всех языках.

Как правило, поддержка 7z кажется ограниченной. Если вы можете использовать альтернативные форматы (zip/gzip), то я думаю, что вы найдете диапазон библиотек Python (и пример кода) более полным.

Надеюсь, это поможет.