k8s运维过程中,pod异常情况下,需要我们去删除pod来恢复业务,本文总结了pod几种常见的删除方法。
常规删除
直接根据pod名称删除是最常见的方式,删除后如果pod使用deployment创建一般会自动创建新的容器。
复制
1. kubectl delete pods deployment-ngx-8ff559dc9 -n kube-system
2. pod "deployment-ngx-8ff559dc9" deleted
还可以使用下面这些命令来删除pod
复制
1. 通过pod.json文件中指定的资源类型和名称删除一个pod
2. $ kubectl delete -f ./pod.json
3. 删除所有名为"”baz"和"foo"的pod和service
4. $ kubectl delete pod,service baz foo
5. 删除所有带有lable name=myLabel的pod和service
6. $ kubectl delete pods,services -l name=myLabel
7. 删除UID为1234-56-7890-234234-456456的pod
8. $ kubectl delete pod 1234-56-7890-234234-456456
9. 删除所有的pod,用于机器异常状况下的快速恢复
10. $ kubectl delete pods --all
直接删除pod的方式,由于deployment资源定义了pod的副本数量,会将pod维持在期望的状态,如果想彻底删除,则需要删除对应的deployment
复制
1. kubectl delete deployment name -n [namespace] #加-n指定命令空间
- 根据标签删除
查看pod中的标签。
复制
1. kubectl get pod --show-labels
2. NAME READY STATUS RESTARTS AGE LABELS
3. nginx1 1/1 Running 0 4h59m
4. nodejs-1 1/1 Running 0 5h7m env=Basic_version,versions=test
5. nodejs-2 1/1 Running 0 3h48m env=development_version,versions=Minor_upgrade1
删除带有 versions=test 标签的pod,这种方法其实也是直接删除pod,只是运动标签的功能快速删除,前提是你使用了标签。
复制
1. kubectl delete pod -l versions=testpod "
2. nodejs-1" deleted
- 副本伸缩
生产环境中,经常会根据业务量的变化来调整pod的副本个数,也可以用这种方式来删除pod,或者用作升级过程中关闭业务入口。
复制
1. kubectl scale deploy/nginx-1 --replicas=0 -n [namespace] #将副本个数缩为0
kubectl scale可以操作deployment副本伸缩,通过修改--replicas的数量来实现缩容和扩容。
- 强制删除
Teminating是比较常见的pod状态,这种状态一般是pod处于销毁状态但是并没有正常删除。
复制
1. [root@k8s-master ~]# kubectl get pods
2. NAME READY STATUS RESTARTS AGE
3. deployment-ngx-8ff559dc9 0/1 Terminating 0 6m10s
4. deployment-ngx-8ff559dc9 0/1 Terminating 0 16m
遇到node宕机或者失联太久可能就会导致pod一直处于Terminating状态,这时候使用kubectl delete不一定可以删除,这种状态下pod已经确定已经无法提供服务了。
复制
1. kubectl delete pod [pod name] --force --grace-period=0 -n [namespace]
Kubernetes中提供了grace-period参数,在Pod删除时此选项会起作用,会延迟一定时长才进行删除,缺省未设定的情况下会等待30s之后删除,此处我们指定grace-period为0,表示立刻删除pod。
为什么要延迟删除? 判断的标准是 DeletionGracePeriodSeconds 值是否为 0,不为零则是优雅删除,apiserver 不会立即将这个对象从etcd中删除,否则直接删除。对于Pod而言,默认 DeletionGracePeriodSeconds为30 秒,因此这里不会被立刻删除掉,DeletionGracePeriodSeconds 设置为默认值 30 秒。在删除之前,很多容器化的应用往往还有一些操作需要处理,而这些都需要一些时间。
- etcd中删除
先找到etcd的三个证书相关文件,在目录 /etc/kubernetes/pki/etcd/ 下
证书位置查看
systemctl status etcd
执行命令查找pod
复制
1. ETCDCTL_API=3 etcdctl --endpoints=https://ip:2379 --cacert=/etc/kubernetes/pki/etcd/ca.pem --cert=/etc/kubernetes/pki/etcd/etcd-client.pem --key=/etc/kubernetes/pki/etcd/etcd-client-key.pem get /registry/pod --prefix --keys-only | grep {pod-name}
执行命令删除pod
复制
1. ETCDCTL_API=3 etcdctl --endpoints=https://ip:2379 --cacert=/etc/kubernetes/pki/etcd/ca.pem --cert=/etc/kubernetes/pki/etcd/etcd-client.pem --key=/etc/kubernetes/pki/etcd/etcd-client-key.pem del /registry/pods/default/{pod-name}
来源: 运维之美
>>>>>>点击进入系统运维专题