Как повторно интегрировать репозиторий svn и git без общей истории?

У меня есть репозиторий git на основе github, который представляет собой разработку до определенной точки, а затем репозиторий svn, не инициализированный с помощью git svn, который имеет дальнейшую разработку. Я хочу принести изменения svn в репозиторий git, начните использовать репозиторий git для разработки и нажмите изменения, используя git svn dcommit. Это возможно? Целесообразно?

Вот мои особенности:

Мы начали разработку плагина WordPress здесь:

http://github.com/mrdoornbos/wpconfidentcaptcha

Мастер находится в ef82b94a1232b44aae3e, и никаких дальнейших изменений в github не было.

Когда наше приложение на wp-plugins.org было принято, для нас было создано пустое svn repo:

http://svn.wp-plugins.org/wp-confident-captcha/[email protected]

Затем были скопированы некоторые измененные файлы (r256425). Дальнейшие изменения были сделаны, последний из них был r278935.

Я хочу, чтобы изменения SVN были применены к master вместе с метаданными git svn.

Вот что я до сих пор (занимает около 4 минут):

git clone git://github.com/mrdoornbos/wpconfidentcaptcha.git github_cc
cd github_cc
git svn init --stdlayout --prefix="svn/" http://svn.wp-plugins.org/wp-confident-captcha
git svn fetch --revision 256362:278935

Это ставит мое дерево github в origin/master и мое svn-дерево в svn/trunk (и все теги в их собственных ветвях /svn ). Нет общего предка между источником/хозяином и svn/trunk. Я не уверен, куда идти отсюда, или если есть способ получить изменения из svn/trunk на origin/master, так что глава двух репозиториев будет иметь одинаковые файлы и пусть git svn dcommit работать от источника/мастера.

Начиная с нового gythub-репо, кажется самым простым способом, и мне было бы не грустно потерять раннюю историю. Но, похоже, должен быть способ сделать эту работу с существующим реестром github.

(Edit: похоже, что это уже было задано как Как объединить две ветки без общего предка?, но без примера git filter-branch, необходимого для его создания В отличие от этого вопроса, это public svn и git repos, поэтому возможен ответ с рабочим script.)

Ответ 1

Вот что сработало для меня:

  • Импортируйте истории git и svn в один репозиторий,
  • Используйте графты и ветвь фильтра, чтобы привязать дерево svn к головке git и
  • Reset метаданные git -svn для использования новой истории.

Истории импорта

Эта часть уже была описана в вопросе:

$ git clone git://github.com/mrdoornbos/wpconfidentcaptcha.git github_cc
$ cd github_cc
$ git svn init --stdlayout --prefix="svn/" http://svn.wp-plugins.org/wp-confident-captcha
$ git svn fetch --revision 256362:278935 # Takes about 4 minutes

Теперь история выглядит так (дружественные имена коммитов в parens):

$ git log --oneline --graph svn/trunk
* d9c713a (svn-z) Bump stable to 1.5.4
* 3febe34 (svn-y) Set display style to modal
... (other commits in svn tree)
* 2687d6a (svn-b) initial checkin
* 5c48853 (svn-a) adding wp-confident-captcha by mrdoornbos

$ git log --oneline --graph master
* ef82b94 (git-z) putting js file back
... (other commits in git tree)
* 8806456 (git-a) initial import

В репозитории существует в основном две независимые истории, и к ним присоединятся некоторые гимнастики.

Графт, слияние и фильтр для перезаписи истории

В части 2 я использую трансплантат, чтобы последний git зафиксировал родителя первого svn commit:

$ GRAFT_PARENT_GIT=`git log --pretty=format:'%H' -1 master`
$ GRAFT_FIRST_SVN=`git log --pretty=format:'%H' svn/trunk | tail -n1`
$ echo $GRAFT_FIRST_SVN $GRAFT_PARENT_GIT > .git/info/grafts
$ cat .git/info/grafts
5c48853d69cac0a4471fe96debb6ab2e2f9fb604 ef82b94a1232b44aae3ee5a998c2fa33acb6dcb0

Теперь слияние супер гладкое:

$ git merge svn/trunk
Updating ef82b94..d9c713a
Fast-forward
 .gitignore                                   |    3 -
(rest of merge lines removed)

$ git log --oneline --graph master
* d9c713a (svn-z) Bump stable to 1.5.4
* 3febe34 (svn-y) Set display style to modal
... (other commits in svn tree)    
* 2687d6a (svn-b) initial checkin
* 5c48853 (svn-a) adding wp-confident-captcha by mrdoornbos
* ef82b94 (git-z) putting js file back

$ git svn info
Path: .
URL: http://svn.wp-plugins.org/wp-confident-captcha/trunk
Repository Root: http://svn.wp-plugins.org
Repository UUID: b8457f37-d9ea-0310-8a92-e5e31aec5664
Revision: 278935
Node Kind: directory
Schedule: normal
Last Changed Author: Confident Technologies
Last Changed Rev: 278935
Last Changed Date: 2010-08-21 00:04:49 -0500 (Sat, 21 Aug 2010)

Это будет работать, но трансплантаты не переносятся на репозитории. Если я придерживаюсь стратегии трансплантата, тогда всем, кто хочет работать с svn repo, придется воссоздать сам трансплантат. Это достаточно легко для script, но это тот случай, когда я могу сделать лучше, используя git filter-branch. Эта команда используется для перезаписи истории git и имеет некоторые действительно мощные параметры. Однако команда по умолчанию делает именно то, что я хочу: перекомпонуйте хэши фиксации, принимая во внимание любые "поддельные" родители, добавленные с помощью трансплантатов:

$ git filter-branch master
Rewrite d9c713a99684e07c362b213f4eea78ab1151e0a4 (71/71)
Ref 'refs/heads/master' was rewritten

$ git log --oneline --graph master
* 51909da (svn-z') Bump stable to 1.5.4
* 7669355 (svn-y') Set display style to modal
... (other re-hashed commits in svn tree)  
* aed5656 (svn-b') initial checkin
* 0a079cf (svn-a') adding wp-confident-captcha by mrdoornbos
* ef82b94 (git-z) putting js file back

Теперь история git выглядит как правильная последовательность изменений, а другие будут видеть одну и ту же последовательность без беспорядка с помощью трансплантатов.

Восстановить git -svn Метаданные

Git счастлив, но git -svn не:

$ git svn info
Unable to determine upstream SVN information from working tree history

$ git log --oneline --graph svn/trunk
* d9c713a (svn-z) Bump stable to 1.5.4
* 3febe34 (svn-y) Set display style to modal

git -svn сохраняет свои собственные метаданные о commits (в .git/svn/*) и смотрит на refspec refs/remotes/svn/trunk branch (как указано в config во время git svn init) чтобы определить, что делает команда svn head. Мне нужно указать ствол svn на новый коммит, а затем воссоздать метаданные. Это та часть, на которой я не уверен на 100%, но она работает для меня:

$ GIT_NEW_SVN_TRUNK=`git log --pretty=format:'%H' -1 master`
$ echo $GIT_NEW_SVN_TRUNK
51909da6a235b3851d5f76a44ba0e2d128ded465
$ git update-ref --no-deref refs/remotes/svn/trunk $GIT_NEW_SVN_TRUNK
$ rm -rf .git/svn  # Clear the metadata cache
$ git svn info     # Force a rebuild of the metadata cache
Migrating from a git-svn v1 layout...
Data from a previous version of git-svn exists, but
  .git/svn
  (required for this version (1.7.3.1) of git-svn) does not exist.
Done migrating from a git-svn v1 layout
Rebuilding .git/svn/refs/remotes/svn/trunk/.rev_map.b8457f37-d9ea-0310-8a92-e5e31aec5664 ...
r256362 = 0a079cfe51e4641da31342afb88f8b47a0b3f2f3
r256425 = aed565642990be56edc5d1d6be7fa9075bab880d
(...more lines omitted)
r278933 = 766935586d22770c3ef536442bb9e57ca3708118
r278935 = 51909da6a235b3851d5f76a44ba0e2d128ded465
Done rebuilding .git/svn/refs/remotes/svn/trunk/.rev_map.b8457f37-d9ea-0310-8a92-e5e31aec5664
Path: .
URL: http://svn.wp-plugins.org/wp-confident-captcha/trunk
(...and the rest of the git svn info output from above)

Восстановить git -svn Метаданные на клоне

Если кто-то клонирует из моего репозитория git, они получают большую часть метаданных git -svn в форме сообщений фиксации, но недостаточно для использования git -svn. Большинству людей это не понадобится, но когда-нибудь мне нужно будет создать новый компьютер или обучить мою замену. Вот то, что сработало для меня:

$ cd ..
$ git clone github_cc github_cc2
$ cd github_cc2
$ git svn init --stdlayout --prefix="svn/" http://svn.wp-plugins.org/wp-confident-captcha
$ git update-ref --no-deref refs/remotes/svn/trunk 51909da6a235b3851d5f76a44ba0e2d128ded465
$ git svn info
Rebuilding .git/svn/refs/remotes/svn/trunk/.rev_map.b8457f37-d9ea-0310-8a92-e5e31aec5664 ...
r256362 = 0a079cfe51e4641da31342afb88f8b47a0b3f2f3
r256425 = aed565642990be56edc5d1d6be7fa9075bab880d
(...more lines omitted)
r278933 = 766935586d22770c3ef536442bb9e57ca3708118
r278935 = 51909da6a235b3851d5f76a44ba0e2d128ded465
Done rebuilding .git/svn/refs/remotes/svn/trunk/.rev_map.b8457f37-d9ea-0310-8a92-e5e31aec5664
Path: .
URL: http://svn.wp-plugins.org/wp-confident-captcha/trunk
(...and the rest of the git svn info output from above)

Теперь svn-багажник готов. Чтобы получить теги, мне пришлось повторно выбрать:

$ git svn fetch -r256362:278935
(Lots of output, seemed to be about 4 minutes again
$ git svn rebase # Fetch the rest of svn history and update metadata

Я не уверен, будет ли эта точная последовательность работать после того, как в дереве будет больше истории.

Я получил несколько сообщений во время git svn rebase:

W: Refspec glob conflict (ref: refs/remotes/svn/trunk):
expected path: wp-confident-captcha/branches/trunk
    real path: wp-confident-captcha/trunk
Continuing ahead with wp-confident-captcha/trunk

Я исправил их, вручную установив конфигурацию svn в .git/config:

[svn-remote "svn"]
  url = http://svn.wp-plugins.org
  fetch = wp-confident-captcha/trunk:refs/remotes/svn/trunk
  branches = wp-confident-captcha/branches/*:refs/remotes/svn/branches/*
  tags = wp-confident-captcha/tags/*:refs/remotes/svn/tags/*

Резюме

Это большая работа, чтобы сделать работу git svn rebase и git svn dcommit. Я многому научился о git и git svn, но я не уверен, что конечная цель стоила того. Для этого случая использования (иногда обновляя репозиторий svn в HEAD репозитория git), некоторые пользовательские сценарии могли быть более эффективными.

Ответ 2

Просто слить его?

git checkout master
git merge -X theirs svn/trunk