• 0

    如何清洗 Git Repo 代碼倉庫

    jopen 10年前發布 | 119K 次閱讀 Git 版本控制系統

    相信不少團隊的代碼倉庫 Git Repo 變得越來越大。除了代碼的提交外,時常有人會把二進制文件比如 Jar 包或者不小心把不改提交到代碼庫的文件提交到代碼庫中,比如用戶名密碼之類的保密信息。如何清洗代碼倉庫 Git Repo,徹底從歷史中刪除此類文件呢?
    git.jpg

    手動清理

    如果你們的代碼倉庫問題比較少,只有幾個不該提交的文件,可以參考 Atlassian 的一篇關于維護 Git Repo 的文章(見文章最后的鏈接)。

    大致過程如下:

    首先進行 Git 垃圾回收:

    git gc --auto

    其次查看 Git 倉庫占用空間:

    $ du -hs .git/objects 45M .git/objects

    然后找出歷史中超過一定大小的文件,最后在歷史中刪除并且提交。如果感興趣手動處理這個過程可以參照文章后邊的鏈接。

    相關的幾個命令:

    清理歷史中的文件:

    git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch ****/nohup.out' --prune-empty --tag-name-filter cat -- --all git filter-branch --index-filter 'git rm --cached --ignore-unmatch ****/nohup.out' HEAD git for-each-ref --format="%(refname)" refs/original/ | xargs -n 1 git update-ref -d

    強制提交覆蓋:

    git reflog expire --expire=now --all git gc --prune=now git push --all --force git push --all --tags --force
    </div>

    但是這個方案有 2 個問題:1. 處理速度慢,嘗試清理 2 G 大小的代碼庫,用了 1 晚上還沒跑完。2. 只能按文件名清理,如果不同的路徑有同樣的文件名就無法處理了,可能誤刪文件或者忽略某些文件。當然有個非常好的解決方案完美解決了這個問題。

    自動清理

    答案就是 bfg-repo-cleaner,這是一個 Java 寫的清理工具,多線程處理清理過程,命令很簡單,只需要幾分鐘就清理了之前 1 晚上都跑不完的任務:

    java -jar bfg-1.11.7.jar --delete-files *.zip myrepo.git java -jar bfg-1.11.7.jar --delete-files *.log myrepo.git java -jar bfg-1.11.7.jar --delete-files *.out myrepo.git java -jar bfg-1.11.7.jar --strip-blobs-bigger-than 1M myrepo.git
    </div>

    附上幾個常用的但又不常見的 git 小技巧:

    復制代碼倉庫:

    git clone --bare /var/www/html/myrepo.git

    Git 后悔藥,覆蓋最后一次修改:

    </div>

    git add . git commit --amend git push origin master -f

    Git 放棄本地修改:

    git checkout .

    Git 銷毀最后一次提交:

    git reset --hard HEAD^ git push -f origin HEAD^:master

    打包時候嵌入版本號:

    git rev-parse HEAD > version.txt

    文章中涉及的鏈接:

  • https://confluence.atlassian.com/display/BITBUCKET/Maintaining+a+Git+Repository
  • http://rtyley.github.io/bfg-repo-cleaner/
  • http://www.d-wood.com/blog/2014/10/03_6965.html
  • </div>
    來自:http://blog.eood.cn/how-to-clean-up-git-repo

     本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
     轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
     本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!
  • sesese色