Kubernetes的故障问题 | SRCco.de

栏目: 编程工具 · 发布时间: 5年前

内容简介:我开始编制一份自2016年我们在Zalando开始使用Kubernetes以来,我们收集了许多内部故障问题。Docker的bug(我们在演讲中分享了一些事件和Kubernetes失败:

我开始编制一份 与Kubernetes有关的公共故障/恐怖故事清单 。它应该能使负责运维的人员更容易找到相应的中断问题。

自2016年我们在Zalando开始使用Kubernetes以来,我们收集了许多内部故障问题。Docker的bug( 守护进程没有响应 ,进程陷入管道等待,......)在一开始就是一个主要的痛点,但 Docker 本身已经变得更加成熟并且最近没有让我们烦恼。最大的问题可归因于分布式系统的性质和“级联故障”,例如Kubernetes API服务器中断不应影响正在运行的工作负载,但事实上 确实如此 ,或者看到 我们最近的CoreDNS事件

我们在演讲中分享了一些事件和Kubernetes失败:

我对失败进行此类讨论的主要动机是我希望自己能够听到更多这些内容!Nordstrom 在KubeCon 2017上演讲“101种方式崩溃你的群集” 是我的灵感(因为你甚至可以从谈话标题的相似性中看出来;-))。我希望看到更多的人分享他们的事后记录并给出失败的谈话。Monzo的透明度和 公共尸检 是对社区的一项伟大服务,应该是我们所有人都努力的方向。

编制Kubernetes失败故事列表

在我寻找更多公共Kubernetes失败故事的过程中,我发现它要么很难找到它们(或者我的网络搜索技能缺乏),要么只发布很少。搜索条件我在 DuckDuckGo 和Google 上试过:

我还尝试了各种组合和“k8s”,“kube-dns”和“kube-proxy”而不是“kubernetes”。这并没有产生很多结果,我发现的大多数页面都是某种更“成功”的故事,并强调如何防止中断发生。那很无聊!

到目前为止我发现的Kubernetes Failure Stories编译列表可以在GitHub上找到 。我希望从社区中看到许多对该列表的贡献,但我想很难鼓励人们发布他们的中断报告。 请通过打开问题,创建公关或 在Twitter上与我联系 ,为列表做出贡献!


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

软件测试的艺术

软件测试的艺术

梅尔斯 / 机械工业出版社 / 2006年01月 / 22.0

《软件测试的艺术》(原书第2版)成功、有效地进行软件测试的实用策略和技术:    基本的测试原理和策略      验收测试    程序检查和走查         安装测试    代码检查            模块(单元)测试    错误列表            测试规划与控制    同行评分            独立测试机构    黑盒、白盒测试    ......一起来看看 《软件测试的艺术》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

MD5 加密
MD5 加密

MD5 加密工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器