Kubernetes的故障问题 | SRCco.de

栏目: 编程工具 · 发布时间: 7年前

内容简介:我开始编制一份自2016年我们在Zalando开始使用Kubernetes以来,我们收集了许多内部故障问题。Docker的bug(我们在演讲中分享了一些事件和Kubernetes失败:

我开始编制一份 与Kubernetes有关的公共故障/恐怖故事清单 。它应该能使负责运维的人员更容易找到相应的中断问题。

自2016年我们在Zalando开始使用Kubernetes以来,我们收集了许多内部故障问题。Docker的bug( 守护进程没有响应 ,进程陷入管道等待,......)在一开始就是一个主要的痛点,但 Docker 本身已经变得更加成熟并且最近没有让我们烦恼。最大的问题可归因于分布式系统的性质和“级联故障”,例如Kubernetes API服务器中断不应影响正在运行的工作负载,但事实上 确实如此 ,或者看到 我们最近的CoreDNS事件

我们在演讲中分享了一些事件和Kubernetes失败:

我对失败进行此类讨论的主要动机是我希望自己能够听到更多这些内容!Nordstrom 在KubeCon 2017上演讲“101种方式崩溃你的群集” 是我的灵感(因为你甚至可以从谈话标题的相似性中看出来;-))。我希望看到更多的人分享他们的事后记录并给出失败的谈话。Monzo的透明度和 公共尸检 是对社区的一项伟大服务,应该是我们所有人都努力的方向。

编制Kubernetes失败故事列表

在我寻找更多公共Kubernetes失败故事的过程中,我发现它要么很难找到它们(或者我的网络搜索技能缺乏),要么只发布很少。搜索条件我在 DuckDuckGo 和Google 上试过:

我还尝试了各种组合和“k8s”,“kube-dns”和“kube-proxy”而不是“kubernetes”。这并没有产生很多结果,我发现的大多数页面都是某种更“成功”的故事,并强调如何防止中断发生。那很无聊!

到目前为止我发现的Kubernetes Failure Stories编译列表可以在GitHub上找到 。我希望从社区中看到许多对该列表的贡献,但我想很难鼓励人们发布他们的中断报告。 请通过打开问题,创建公关或 在Twitter上与我联系 ,为列表做出贡献!


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

企业应用架构模式

企业应用架构模式

Martin Fowler / 人民邮电出版社 / 2009 / 79.00元

随着信息技术的广泛应用,系统需要处理的数据量越来越大,企业级软件开发已经渐成主流,而开发人员面临的困难与挑战也是显而易见的。更糟糕的是,这一领域的资料一直非常缺乏。 本书是软件开发大师Martin Fowler的代表作,采用模式的形式系统总结了业界多年积累的经验,被称为“企业级应用开发领域的圣经”,出版以来一直畅销不衰,至今仍然无可替代。作 者在精彩地阐述了企业应用开发和设计中的核心原则基础......一起来看看 《企业应用架构模式》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换