内容简介:环境:Rancher管控的K8S集群。现象:某个Node频繁出现“PLEG is not healthy: pleg was last seen active 3m46.752815514s ago; threshold is 3m0s”错误,频率在5-10分钟就会出现一次。排查:
环境:Rancher管控的K8S集群。
现象:某个Node频繁出现“PLEG is not healthy: pleg was last seen active 3m46.752815514s ago; threshold is 3m0s”错误,频率在5-10分钟就会出现一次。
排查:
-
kubectl get pods --all-namespaces
发现有一个istio-ingressgateway-6bbdd58f8c-nlgnd
一直处于Terminating状态,也就是说杀不死。 -
到Node上
docker logs --tail 100 kubelet
也看到这个Pod的状态异常:I0218 01:21:17.383650 10311 kubelet.go:1775] skipping pod synchronization - [PLEG is not healthy: pleg was last seen active 3m46.752815514s ago; threshold is 3m0s] ... E0218 01:21:30.654433 10311 generic.go:271] PLEG: pod istio-ingressgateway-6bbdd58f8c-nlgnd/istio-system failed reinspection: rpc error: code = DeadlineExceeded desc = context deadline exceeded
-
用
kubelet delete pod
尝试删除,命令挂住。 -
用
kubectl delete pod --force --grace-period=0
,强制删除Pod。 -
再到Node上检查这个容器是否真的被停止,
docker ps -a| grep ingressgateway-6bbdd58f8c-nlgnd
,看到容器处于Exited状态。 - 观察Node状态,问题依旧。
-
把Pod关联的Deployment删除,把一只处于Terminating的Pod用
kubectl delete pod --force --grace-period=0
的方式删除。 - 重新部署Deployment。
- 问题解决。
相关 issue
以上所述就是小编给大家介绍的《Kublet PLEG不健康问题排障》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- acme.sh 续期问题(路径问题)
- 缓存的一些问题和一些加密算法【缓存问题】
- 如何把设计问题转化为数学问题(方法论)
- 推荐系统中的冷启动问题和探索利用问题
- GraphQL 教程(六)—— N+1问题和缓存等问题
- Golang 并发问题(四)之单核上的并发问题
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
群体智能
James Kennedy、Russell C Eberhart、Yuhui Shi / 人民邮电出版社 / 2009-2-1 / 75.00元
群体智能是近年来发展迅速的人工智能学科领域.通过研究分散,自组织的动物群体和人类社会的智能行为, 学者们提出了许多迥异于传统思路的智能算法, 很好地解决了不少原来非常棘手的复杂工程问题.与蚁群算法齐名的粒子群优化(particle swarm optimization, 简称PSO)算法就是其中最受瞩目,应用最为广泛的成果之一. 本书由粒子群优化算法之父撰写,是该领域毋庸置疑的经典著作.作者......一起来看看 《群体智能》 这本书的介绍吧!