内容简介:Zabbix监控Windows进程重启
前段时间,一个朋友咨询我怎么监控Windows进程的重启。生产环境有监控进程的启动和关闭,但重启还没想过。经过一番思考和摸索后成功完成了监控,下面把监控思路和方法分享给大家。
我首先想到的是通过Zabbix自带的进程数监控(proc.num)来做,但有两个难点:一、进程数从1变为0再变为1,算是一次重启。触发器要判断三次连续的监控数据,不太好做;二、进程从关闭到下次启动,中间间隔多长时间算是一次重启呢?
然后想到了zabbix监控操作系统的重启,比如Windows系统重启的触发器:{Template OS Windows:system.uptime.change(0)}<0,zabbix是通过监控系统运行时长来判断的,即系统运行时长的变化小于0就可以断定服务器重启了。同样的,如果我们监控了进程的运行时长,那么重启就很好判断了。
下一步着手监控Windows进程的运行时长。想到了zabbix原生支持监控Windows performance counters(Windows性能监视器),可以从Windows性能监视器里面查找是否有对进程运行时长的监控。登录一台Windows Server 2008服务器,上去查看一下性能监视器,还真找到了,见下图:
从Process类别里找到了“Elapsed Time”,这就是进程总运行时间的意思。再从下面一栏选择一个进程(比如zabbix_agentd,不带.exe后缀)。
添加好后,右键选择“属性”:
可以看到我们刚才添加的计数器为: \Process(zabbix_agentd)\Elapsed Time
退出设置,然后查看计数器的数据,进程当前运行时长14349806秒:
重启进程zabbix_agentd,再观察一下,最新计数从0开始了:
方法 找到 了,我们创建监控项和触发器。博客地址:http://qicheng0211.blog.51cto.com/
先创建监控项:
监控项名称:zabbix_agentd进程运行时间
监控项类型:Zabbix agent
监控项Key: perf_counter["\Process(zabbix_agentd)\Elapsed Time"]
数据类型:float
单位:s
监控间隔:30
注:perf_counter的参数就是上面添加的性能计数器。
创建触发器:
触发器名字:zabbix_agentd进程重启!
触发器表达式: {windows.60.61:perf_counter["\Process(zabbix_agentd)\Elapsed Time"].change()}<0
表达式含义:监控项最新监控数据和上一个数据的差值小于0,则触发器触发。
下面我们测试一下,重启进程后观察是否产生告警:
等待一会,触发器成功被触发,触发状态持续30秒。
到这我们对Windows进程重启的监控就完成了。
原创文章,转载请注明出处,尊重博主劳动成果,感谢。
以上所述就是小编给大家介绍的《Zabbix监控Windows进程重启》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- Golang 创建守护进程以及平滑重启
- python练手脚本-定时检测无响应进程并重启
- gf v0.98 beta,热重启、文件锁、进程管理通信等更多新特性
- Golang实现平滑重启(优雅重启)
- SOFAMosn 无损重启/升级
- nginx-平滑重启
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
大数据大创新:阿里巴巴云上数据中台之道
邓中华 / 电子工业出版社 / 2018-11 / 99
阿里巴巴云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在帮助决策层看清甚至决定业态走向的同时,在上万个业务场景中应用并催生创新。 《大数据大创新:阿里巴巴云上数据中台之道》基于作者在阿里巴巴的十年大数据从业经历,精彩演绎云上数据中台之道。《大数据大创新:阿里巴巴云上数据中台之道》基于大数据探索的大趋势,讲述阿里巴巴云上数据中台顶层设计,再以实际案例详述阿里巴巴云上数......一起来看看 《大数据大创新:阿里巴巴云上数据中台之道》 这本书的介绍吧!