git仓库清理找了很多资料和方案都没有很完美执行成功的;现在找到一个完美方案,分享给大家;希望能帮助大家
问题
gitlab代码开发了仓库开发了五年了,代码只有10M;clone的时候要700多兆很浪费时间
2、创建分支和切换分支耗时,导致电脑崩溃
3、公司内部接入codereview服务;因为项目过大服务器承载不了,接入失败
git仓库过大的原因:
1、历史提交的文件,后来删除了,但是.git\objects\pack还会记录保持这些文件
2、git rev-list --objects --all | grep “$(git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -500 | awk ‘{print$1}’)”
执行上面命令,查看前500个大文件;发现全是dist目录的文件上传有2000多个
解决方案:
方案一:(2个小时耗时,不保证成功)
下面通用方案不行了;这种方法清理非常耗时而且代码分支多的不容易成功
清理文件git filter-branch --force --index-filter "git rm -rf --cached --ignore-unmatch 文件/文件夹" --prune-empty --tag-name-filter cat -- --all# 查看历史大文件git rev-list --objects --all | grep "$(git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -5 | awk '{print$1}')"# 从历史中删除 target/ 这个文件夹git filter-branch --force --index-filter 'git rm -r --cached --ignore-unmatch target/' --prune-empty --tag-name-filter cat -- --all# 执行仓库压缩git gc --prune=now# 推送到远程仓库git push origin --force --all
推荐方案二BGF工具清理:(亲测有效10分钟搞定)
必备条件
1、安装java环境(java安装教程)
2、下载好bfg的jar包 (下载链接-官网右上角 download 按钮进行下载);
第一步:克隆你的项目.git文件
加–mirror是只clone你项目的.git文件
第二步:把你下载的bfg的jar包复制到这个项目同目录下
第三步:执行命令查看大文件的目录(500个文件)
git rev-list --objects --all | grep "$(git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -500 | awk '{print$1}')"
第四步:最重要的一步
java -jar bfg-1.14.0.jar --delete-folders {dist} --no-blob-protection frontend_saas.git
一分钟左右1500个dist目录里的文件会全部清除很快;比git filter-branch两个小时快多了
第五步:执行GC压缩
git reflog expire --expire=now --all && git gc --prune=now --aggressive
第六步:推送到远程
git push --mirror
第七步:注意项目开发的的小伙伴要全部重新clone项目开发;注意一定不能在原来400多兆都是项目里开发提交,这样项目的垃圾文件又会恢复,前功尽弃;
总结:到这里就大功告成了;446M的项目清理之后只有23.7M干净很多;
来源地址:https://blog.csdn.net/weixin_41791737/article/details/128646757