Subversion diff для zipped xml файла

Я использую MySQL Workbench для поддержки схемы базы данных для приложения. Файл .mwb, который использует Workbench, который является заархивированным XML-документом, хранится в репозитории Subversion.

Файл рассматривается как двоичные данные Subversion, поэтому я не могу использовать svn diff для отображения изменений, например, перед фиксацией.

Поскольку данные действительно являются XML, я думаю, что может быть какой-то способ показать diff в любом случае, возможно, какой-то script, который распаковывает файл раньше или какой-то плагин в svn diff.

Идеальное решение позволило бы:

$ svn diff db-model.mwb

или даже используя Meld:

$ meld db-model.mwb

Какой подход вы можете придумать для этого? Возможно, у кого-то была проблема с отображением diff для архивных текстовых файлов в Subversion.

Ответ 1

Subversion позволяет использовать инструменты внешнего разнесения. Что вы можете сделать, это написать оболочку script и сообщить Subversion использовать ее как команду "diff". Ваша обертка проанализирует аргументы, которые она получает из Subversion, чтобы выбрать "левые" и "правильные" имена файлов, работать на них и вернуть код ошибки, который Subversion будет интерпретировать как успех или сбой. В вашем случае оболочка может распаковать файлы XML и передать распакованные результаты "diff" или другой инструмент по вашему выбору.

Subversion будет препятствовать разным файлам, которые были обнаружены как "двоичные", когда они были проверены. Опция "-force" позволяет вам переопределить эту проверку, поэтому ваша обертка script будет запущена, даже если входные файлы проверяются как двоичные файлы.

Ответ 2

Я написал diff script для файлов workbench, которые могут быть интегрированы с TortoiseSVN и TortoiseGit, которые точно будут делать то, что предлагает Джим Льюис: Извлеките фактический XML из архива и проанализируйте его.

script также устранит все шумы ptr-Attribute в diff. Слияние невозможно и будет немного сложнее (узнайте, как будут выглядеть атрибуты ptr, перекомпилируйте XML в архив, что с другими метаданными в архиве?,...)

Питон script доступен в пастебине под CC-BY 3.0:

http://pastebin.com/AcD7dBNH

# extensions: mwb
# TortoiseSVN Diff script for MySQL Workbench scheme files
# 2012 by Oliver Iking, Z-Software GmbH, oliverikingREPLACETHISWITHANATz-software.net, http://www.z-software.net/
# This work is licensed under a Creative Commons Attribution 3.0 Unported License - http://creativecommons.org/licenses/by/3.0/

# Will produce two diffable documents, which don't resemble the FULL MWB content, but the scheme relevant data. 
# Merging is not possible

# Open your TortoiseSVN (or TortoiseSomething) settings, go to the "Diff Viewer" tab and click on "Advanced". Add 
# a row with the extension ".mwb" and a command line of 
# "path\to\python.exe" "path\to\diff-mwb.py" %base %mine
# Apply changes and now you can diff mysql workbench scheme files

import sys
import zipfile
import os
import time
import tempfile
import re

# mysql workbench XML will have _ptr_ attributes which are modified on each save for almost each XML node. Remove the visual litter, 
# make actual changes stand out.
def sanitizeMwbXml( xml ):
    return re.sub('_ptr_="([0-9a-fA-F]{8})"', '', xml)

try:
    if len(sys.argv) < 2:
        print("Not enough parameters, cannot diff documents!")
        sys.exit(1)

    docOld = sys.argv[1]
    docNew = sys.argv[2]

    if not os.path.exists(docOld) or not os.path.exists(docNew):
        print("Documents don't exist, cannot diff!")
        sys.exit(1)

    # Workbench files are actually zip archives
    zipA = zipfile.ZipFile( docOld, 'r' )
    zipB = zipfile.ZipFile( docNew, 'r' )

    tempSubpath = os.tempnam(None,"mwbcompare")

    docA = os.path.join( tempSubpath, "mine.document.mwb.xml" )
    docB = os.path.join( tempSubpath, "theirs.document.mwb.xml" )

    os.makedirs( tempSubpath )

    if os.path.exists(docA) or os.path.exists(docB):
        print("Cannot extract documents, files exist!")
        sys.exit(1)

    # Read, sanitize and write actual scheme XML contents to temporary files

    docABytes = sanitizeMwbXml(zipA.read("document.mwb.xml" ))
    docBBytes = sanitizeMwbXml(zipB.read("document.mwb.xml" ))

    docAFile = open(docA, "w")
    docBFile = open(docB, "w")

    docAFile.write(docABytes)
    docBFile.write(docBBytes)

    docAFile.close()
    docBFile.close()

    os.system("TortoiseProc /command:diff /path:\"" + docA + "\" /path2:\"" + docB + "\"");

    # TortoiseProc will spawn a subprocess so we can't delete the files. They're in the tempdir, so they
    # will be cleaned up eventually
    #os.unlink(docA)
    #os.unlink(docB)

    sys.exit(0)
except Exception as e:
    print str(e)
    # Sleep, or the command window will close
    time.sleep(5)