在腾讯云上创建您的SQL Cluster>>> »  

相信不少团队的代码仓库 Git Repo 变得越来越大。除了代码的提交外,时常有人会把二进制文件比如 Jar 包或者不小心把不改提交到代码库的文件提交到代码库中,比如用户名密码之类的保密信息。如何清洗代码仓库 Git Repo,彻底从历史中删除此类文件呢?

手动清理

如果你们的代码仓库问题比较少,只有几个不该提交的文件,可以参考 Atlassian 的一篇关于维护 Git Repo 的文章(见文章最后的链接)。

大致过程如下:

首先进行 Git 垃圾回收:

1
git gc --auto

其次查看 Git 仓库占用空间:

1
2
$ du -hs .git/objects
45M .git/objects

然后找出历史中超过一定大小的文件,最后在历史中删除并且提交。如果感兴趣手动处理这个过程可以参照文章后边的链接。

相关的几个命令:

清理历史中的文件:

1
2
3
git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch ****/nohup.out' --prune-empty --tag-name-filter cat -- --all
git filter-branch --index-filter 'git rm --cached --ignore-unmatch ****/nohup.out' HEAD
git for-each-ref --format="%(refname)" refs/original/ | xargs -n 1 git update-ref -d

强制提交覆盖:

1
2
3
4
git reflog expire --expire=now --all
git gc --prune=now
git push --all --force
git push --all --tags --force

但是这个方案有 2 个问题:1. 处理速度慢,尝试清理 2 G 大小的代码库,用了 1 晚上还没跑完。2. 只能按文件名清理,如果不同的路径有同样的文件名就无法处理了,可能误删文件或者忽略某些文件。当然有个非常好的解决方案完美解决了这个问题。

自动清理

答案就是 bfg-repo-cleaner,这是一个 Java 写的清理工具,多线程处理清理过程,命令很简单,只需要几分钟就清理了之前 1 晚上都跑不完的任务:

1
2
3
4
java -jar bfg-1.11.7.jar --delete-files *.zip myrepo.git
java -jar bfg-1.11.7.jar --delete-files *.log myrepo.git
java -jar bfg-1.11.7.jar --delete-files *.out myrepo.git
java -jar bfg-1.11.7.jar --strip-blobs-bigger-than 1M myrepo.git

附上几个常用的但又不常见的 git 小技巧:

复制代码仓库:

1
git clone --bare /var/www/html/myrepo.git

Git 后悔药,覆盖最后一次修改:

1
2
3
git add .
git commit --amend
git push origin master -f

Git 放弃本地修改:

1
git checkout .

Git 销毁最后一次提交:

1
2
git reset --hard HEAD^
git push -f origin HEAD^:master

打包时候嵌入版本号:

1
git rev-parse HEAD > version.txt

文章中涉及的链接:

文章来源:Bruce Dou Blog

 
 
 

最新文章

  1. JAVA通信系列二:mina入门总结
  2. Flapper Bird的学习笔记(三)
  3. c++虚函数调用及使用
  4. selinux
  5. android 应用架构随笔二(定义BaseApplication并配置Application)
  6. [VC6]ONMESSAGE()宏编译时出现"sytax error ;"错误时
  7. 【hihoCoder第十七周】最近公共祖先·三
  8. .NetCore之下载文件
  9. Counting Sort(Java)
  10. 使用events.EventEmitter 控制Node.js 程序执行流程
  11. hibernate 嵌套事务
  12. html5离线记事本
  13. Linux学习之查看系统资源命令总结(二十二)
  14. MT【30】椭圆的第二定义解题
  15. web安全防范之SQL注入攻击、攻击原理和防范措施
  16. 九度OJ1122题-吃巧克力
  17. nsi脚本中执行.bat文件要隐藏dos窗口问题
  18. C#中数组数据类型字符串转double型问题
  19. Django入门与实践-第26章:个性化工具(完结)
  20. hexo上部署博客到Github失败

热门文章

  1. jvm运行时环境属性一览
  2. iOS开发笔记6:图片轮播及其无限循环效果
  3. iOS之UI--UITabBarController
  4. NHibernate使用ICriteria分页并返回数据库记录总条数
  5. MFC添加右键菜单
  6. wampserver安装之后连接phpMyAdmin 不成功的解决方法
  7. xamarin.android之 Android 4.4+ 获取图片真实路径
  8. Android Studio调试功能使用总结【转】
  9. beeline vs hive cli
  10. LESSON THREE