泰康保险集团 – IT服务运营中枢

栏目: 服务器 · 发布时间: 5年前

1. 背景

泰康集团已经建成了两地三中心的泰康云,支撑了 传统业务、泰康在线、移动互联网业务和泰康创新等业务 根据泰康保险集团 IT架构转型工作计划,泰康保险集团将在数据中心及各分公司(泰康人寿、泰康资产、泰康养老、泰康之家、泰康健康、泰康在线等)内分步实施云技术(包括:基础设施云IaaS和应用平台云PaaS),实现IT基础设施资源和应用系统的快速部署和灵活调度,以更好地支持各类业务资源交付、业务应用版本投产、日常操作运维和泰康创新业务用等业务的快速发展。

目前泰康集团的数据中心建成了基于 VMware虚拟化和青云私有云的泰康云,分别支撑集团的稳态业务和基于互联网的敏态业务。VMware虚拟化资源池的虚拟机规模在5 000 台左右,青云私有云的虚拟机规模已达到 1 0000 台左右, PaaS软件资源中数据库PaaS服务1 000 个左右,缓存服务 5 00 个左右,负载均衡服务 1 000 个左右。本期项目的建设目标是提供泰康云的 运维自动化、应用上云、应用部署和升级等能力,从而打造一体化、中枢引擎式的泰康云服务平台。

2. 痛点

云资源及环境的交付速度无法适应集团业务的高速发展

泰康在线业务年平均增速 52%,大量的新型互联网型业务需要快速的资源环境响应,业务部门需要分钟级的响应,但泰康数据中心按目前“7步法”的交付方式,最快也只能按天对业务进行响应。数据中心服务交付压力巨大,且靠增加人力方式无法满足更多,更快的业务增长需求

泰康云的 IT 资源规模大,运维压力大

目前泰康云有 VMware虚拟化和青云KVM两大类型的I aaS 资源池,存在大量的计算资源、存储资源、网络资源、 PaaS资源,基础设施运维团队VMware虚拟化运维组、青云私有云运维组、监控组、安全组等各运维职能分组, 50 人左右团队规模,日常运维工作占用了运维人员的大部分时间,导致基础设施运维人员无法进行 IT资源日常巡检、运维自动化建设等能产生长期效益的工作。随着集团业务快速增长,基础设施运维人员不得不面对应用环境申请和上线沟通、应用上线后的资源变更、配置、升级、故障处理等工作量的线性增长,运维压力持续增加。

周边平台多且关系复杂,各平台功能整体无法打通

目前泰康云的周边平台众多,包括 VCenter、青云私有云Ia aS 资源平台、 OpenSh ift 容器云平台、监控告警系统 Zabbix Prometheus CMDB平台、ITSM平台、ELK、Splun k 等日志平台、堡垒机平台、 Dev Ops 工具链上的各 工具 平台。泰康云内部需要在一个入口有效打通各平台的整体功能,以实现资源与环境的一站式交付,加快服务交付速度。

泰康云内部研发团队工作效率的提升

目前泰康云内部有 3 0 人左右的研发团队,团队开发的功能包括云资源管理、监控告警、日志、 DevOps等。开发使用的技术和架构,积累的技术债务众多,研发管理上已经采用基于Scrum的 敏捷研发模式 ,但由于缺乏有效的工具支撑,持续优化的管理机制,对相关敏捷方法未贯彻执行,使当前的敏捷研发模式流于形式,对研发整体效率的提升有限。

应用环境的基础架构复杂、差异性大

泰康云服务的业务部门众多,各业务、应用的基础架构由于开发团队、业务需求等原因,差异性大,比如操作系统版本多、应用中间件种类和版本不统一,各编程语言运行时环境不统一等。应用上线时,基础架构运维和应用运维需要对各种非标准化的应用环境进行大量复杂的运维工作。需要有平台提供可视化的应用环境编排工具,一站式的提供标准化的、符合集团内部应用环境上线要求、安全基线的 Iaa S PaaS的资源堆栈。

3. 解决方案

以自服务方式对业务用户提供个性化的服务目录,加快 IT 服务交付速度

通过元数据定义服务的方式,对同一类型的服务进行抽象,通过服务元数据组成服务,使平台可以快速定义和提供出符合需求的 IT 服务。

通过元数据定义方式提供 VMware计算资源、青云计算资源、数据库、缓存、负载均衡等服务目录,业务用户申请资源时,通过平台统一的申请、审批、自动化交付流程,加快资源交付的速度。

泰康保险集团 – IT服务运营中枢  

优化原来基础设施运维人员的资源交付七步骤,将所有需要手工操作的步骤,在平台以自动化的方式实现,大幅度提升了资源交付的速度,减少了基础设施运维人员的运维工作量。

跨云应用编排

泰康保险集团 – IT服务运营中枢  

平台提供了可视化的蓝图编排功能,提供了计算、存储、网络等基础设施及 应用 中间件 配置、服务和依赖关系 的编排能力 ,核心能力包括:基础设施即代码、执行计划、蓝图版本管理等,将集团内部常用的各基础设施、中间件,典型的应用环境和架构以标准化的方式进行编排并发布成服务目录。实现了应用环境、Iaa S PaaS的资源堆栈的标准化、基线化。业务用户以自服务的方式申请蓝图资源,加快了业务应用上线的速度。

研发团队 DevOps 赋能

泰康保险集团 – IT服务运营中枢  

对泰康云内部研发团队进行了基于 DevOps的研发赋能。具体包括:

微服务架构改造

基于 Spring   Cl oud 的微服务架构进行框架搭建,各微服务组件满足无状态、功能解耦、灵活可扩展的要求。

基于看板的敏捷管理实现

结合基于 JIRA的敏捷看板,实现了研发任务的可视化流转、实时回馈,加快了研发迭代的速度。

持续集成 CI 流水线的建设

建成了持续集成流水线,实现了包括代码自动编译、 Sonar质量检查、单元测试自动化、测试覆盖度统计等步骤的标准流水线。

自动化测试实施

基于 JU nit Sele nium 实现了单元测试覆盖和 UI自动化测试覆盖,提升了代码交付的质量。

通过基于 DevOps的整体研发赋能,使研发团队的研发效率、版本功能交付质量等显著提升,使原来开发迭代速度从一个多月提升到 1 周半的时间。

4. 收益

业务用户申请 VMware 资源、青云私有云资源的 时间从原来平均 一天左 右时间提升到 一小时 内完成交付。

自动生成 基础设施处月度运营分析报告 所需的各类报表,并通过相关报表数据对资源使用和管理过程进行优化,节省了超过 1 0% 的资源成本。

泰康云内部开发团队效率显著提升,自建系统的版本发布频率从一个多月提升到 1 周半。

单一云资源的交付时间平均提升 40% 以上。

泰康云平台的基础设施运维


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

The Art of UNIX Programming

The Art of UNIX Programming

Eric S. Raymond / Addison-Wesley / 2003-10-3 / USD 54.99

Writing better software: 30 years of UNIX development wisdom In this book, five years in the making, the author encapsulates three decades of unwritten, hard-won software engineering wisdom. Raymond b......一起来看看 《The Art of UNIX Programming》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

MD5 加密
MD5 加密

MD5 加密工具