AIOps大神之路

栏目: 服务器 · 发布时间: 6年前

AIOps最近在数据中心圈里常被人所提及,AIOps是何方神物?AIOps的英文全名叫Artificial Intelligence for IT Operations,即智能化运维,目标是基于已有运维数据(日志、监控信息、应用信息等),通过机器学习方式来进一步解决自动化运维所未能解决的问题,提高系统预判能力、稳定性、降低运维成本,提高数据中心竞争力。AIOps是AI、运维和自动化三者的结合体。简单说:AIOps = AI+运维数据+ 自动化处理= AI+Devops,其实就是将AI技术运用到数据中心运维中去,解放人力,这将给数据中心带来翻天覆地的变化,同时也将产生新的岗位需求。数据中心运维一旦插上了AI的翅膀,会飞得越来越高。当然,前提是要掌握飞行的要领。如何迅速成长为一名优秀智能化运维的技术专家,本文将揭开AIOps大神的成长之路。

要想成为一名AIOps技术大神,对AIOps成长史必须是要了解的。AIOps最开始并不叫AIOps,从最原始的人工运维开始,这时主要是利用单独脚本或者一些简单工具,完成数据中心设备的运维;接着不断引入一些工具,通过大量运维工具,提高了运维效率;然后是引入了自动化,将 工具 交给计算机,由计算机按照既定程度来运行,这比人工方式效率提升很多,往往一次要是通过人手工完成可能需要几个小时,而通过自动化工具和脚本,几秒钟就可以完成,这个阶段叫做Devops,也是目前最为主流的运维方式;紧接着随着AI技术的火爆,AIOps开始出现,AIOps是通过机器的自我学习、自行分析决策和自动化去执行脚本。

AIOps首先要有AI,这是和以往运维最大的区别,AI就是机器学习,这是一门非常复杂的多门类交叉学科,核心是各种各样的技术算法,这些算法可以让机器对输入的数据进行学习和判断,最终形成自己的理解,让机器像人一样去思考遇到的各种问题。AI技术有很多算法,比如分类算法、线性回归、逻辑回归、决策树、关联规则、深度学习等等。数据中心每天产生设备日志、故障表项、配置管理等海量数据,这些都是AI学习的基础数据,这些数据能否学好,AI的算法最为关键,已有的AI算法并不适用于所有数据中心,这就需要在AI学习数据中心运维数据的过程中不断调整算法,所以AIOps大神需要懂AI,最好是AI专业走出的高材生,并愿意走入数据中心运维的岗位中来。数据中心的海量数据各种都有,需要根据不同的数据特征设计算法,达到学习的目的。比如数据中心的所有设备端口流量,通过历史流量模型,可以预测下一次的流量洪峰到来的时间,以便做好预防和保护工作,还可以根据流量模型的异常变化,提前发现网络故障,甚至可通过AI自动地化解危险。AIOps大神要懂得如何将这些AI技术运用到数据中心的运维工作中去,并起到作用。

光有AI显然不够,其次还需要脚本语言。自动化脚本已是数据中心运维不可缺少的重要部分,大量运维的工作都需要通过自动化脚本来监控、操作和变更等,大型数据中心拥有海量设备,单靠人海战术是行不通的。脚本语言比如 PythonSQL 、TCL等等,这些语言简单易懂,好上手,不会写脚本的运维不算是真正的运维专家,这也是提升运维效率的直接武器,必须要掌握。自动化脚本会被应用到数据中心的各种数据和设备监控中去,有些也可以用于变更操作、网络切换、信息采集甚至故障定位。现在市场上对Python脚本技术人员缺口很大,这类人员的收入也比较高。AIOps也需要脚本,用脚本来采集信息和执行动作,所以脚本语言必须掌握。

不管是AI还是自动化脚本终究都是为运维服务的,最关键的还是必须要搞清运维的工作内容,懂得哪些工作适合用AIOps,哪些工作不适合,不能什么工作都寄希望于AI。在做数据中心运维时,要知道各种指标如何去监控,知道异常检测的方法,知道故障如何去发现,知道性能如何调优等,对数据中心运维的工作了如指掌。数据中心里有很多IT设备,功能各不相同,有搞服务器的,有搞网络的,还有搞安全的等等,网络架构各不相同,这些都需要长时间的接触和沉淀,逐渐找到针对一个数据中心的运维方法。数据中心的运维内容非常庞杂,性能分析、流量监控、设备运行状态采集、故障感知、变更扩容等等,都是运维的工作内容,在数据中心运维的过程中也输出了运维的管理理念和技术办法,部分运维内容还形成了行业标准,运维的工作伴随着数据中心出现就开始了,俨然已经发展成了一门技术学科。数据中心运维不仅是要确保业务长期平稳运行,还要考虑数据中心的经济效益,如果数据中心的业务增长,运维支出也随之增长,那数据中心依然获得不到利润增长,这就要对运维内容做深入剖析,AIOps面对的就是这些运维工作,所以要对运维内容研究透,AIOps才能有的放矢。要想成为AIOps大神,提前必须是一位出色的数据中心运维的技术专家。

这些年,数据中心规模已经变得非常庞大,承载的业务也越来越多和复杂,这都给运维的工作带来了巨大挑战,数据中心运维的工作内容越来越庞杂,也在不断变化,运维成本和压力越来越大,只有引入AIOps才有可能缓解,充分释放人力。看看这两年全球数据中心运维的技术大会内容,基本上讲的都是AIOps,AIOps技术火了,自然对AIOps技术人才需求也多了,趁着AIOps还未普及,赶紧学习,练好AI、脚本和运维三大斧,就离成为AIOps技术大神不远了。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Ethnography and Virtual Worlds

Ethnography and Virtual Worlds

Tom Boellstorff、Bonnie Nardi、Celia Pearce、T. L. Taylor / Princeton University Press / 2012-9-16 / GBP 21.00

"Ethnography and Virtual Worlds" is the only book of its kind - a concise, comprehensive, and practical guide for students, teachers, designers, and scholars interested in using ethnographic methods t......一起来看看 《Ethnography and Virtual Worlds》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具