监控平台实施方案

栏目: 服务器 · 发布时间: 6年前

内容简介:撰写:田逸(sery@163.com) 监控有效性:监控能正确反应系统、应用运行状态,发生故障能及时告警;对重要对象进行监控,能定位到问题即可;不面面俱到,增加负担及复杂度。 平台可用性:监控平台本身也可能存在故障的风险,因此,需要建立起一套可用性保证机制。一是在硬件层面保证部分硬件失效时,监控服务不受影响;二是万一系统崩溃,能够重建平台并进行数据恢复。

撰写:田逸(sery@163.com)

基本目标

 监控有效性:监控能正确反应系统、应用运行状态,发生故障能及时告警;对重要对象进行监控,能定位到问题即可;不面面俱到,增加负担及复杂度。

 平台可用性:监控平台本身也可能存在故障的风险,因此,需要建立起一套可用性保证机制。一是在硬件层面保证部分硬件失效时,监控服务不受影响;二是万一系统崩溃,能够重建平台并进行数据恢复。

 信息安全性:网络隔离及用户授权。

方案设计

 监控架构

监控分服务器端及被监控端,其中服务器端独立部署,而被监控端根据监控要求,有的监控项需要在被监控端安装插件,而有的不需要。按这个需求来分类,监控主机存活、服务端口或者web的url,不需要在安装插件;而诸如监控系统负载、磁盘空间使用、进程数等,属于主机资源监控的类型,则需要安装插件。

监控平台实施方案

 平台可用性架构

分两个层面,一个是硬件冗余,另一个是备份恢复机制。

(1) 硬件冗余:单台物理主机,保证电源及硬盘冗余及容错,降低down机几率。同时配置相同配置的物理主机,作为备份或者备用机。

(2) 应用层面底层采用虚拟化,监控平台运行与虚拟机,并自动对虚拟机进行异地(机)备份。系统崩溃时,重建系统,用虚拟机备份快速恢复数据。

监控平台实施方案

技术实现

 对象监控实现

监控平台安装在虚拟机上,安装好所需各种组建(web、数据库、 php 等),能通过web界面进行各种管理操作。监控系统采用业内知名的nagios,久经考验,且不存在法律及授权风险。在需要监控主机资源的系统上,安装与nagios配套的插件nrpe,舍弃繁复的snmp,即提高了安全性,又降低了资源的耗费。

 可用性实现

底层用开源私有云工具proxmox虚拟化,在其上创建两个虚拟机,一个用于安装nagios监控,另一个用于安装nfs共享磁盘。两台物理主机,一个上边运行监控系统,而另一台共享出nfs磁盘空间,被挂接到监控系统上,做监控系统的虚拟机自动备份使用。

 监控系统总览

主要项目包括:主机、主机组、服务、服务组、联系人、联系组、监控状态等等。

监控平台实施方案

实施步骤

 物理机上架,通电,连接网络线缆;开机,硬盘做好raid。

 安装底层虚拟化环境,并保证网络连通。

 配置虚拟机环境,并创建所需要的虚拟机。

 安装虚拟机操作系统。

 部署nagios监控、部署nfs共享存储。

 被监控端安装插件,配置并启动守护进行。

 添加监控项,并使之使之生效。

 被监控端人为模拟故障,检查监控是否有效(故障告警、恢复)

工具列表

 监控系统centreon2.8(封装过的nagios),从centreon官方下载,无需授权。

 监控系统插件nagios-plugin,从nagios官方网站下载。

 监控远程插件NRPE(nagios remote plugin executor),从nagios官方网站下载。

 共享存储nfs,linux自带。

 虚拟化管理平台proxmox,从其官方网站下载。

 其它 工具 如apache、php、 mysql 等,从网上下载。

实施要求

 监控服务器能访问到被监控端,无需通过第三方转发;

 监控服务器能访问公网,以便能下载所需的软件和依赖,否则无法进行安装;

 如需要从公网操作监控平台,最好可以分配公网ip;

 被监控端需要开启tcp 5666端口,不能被防火墙所阻止;

 需少数系统临时模拟故障发生,一遍测试监控的有效性;

 需提供使用此监控人员的名单,以便进行合理授权;

 为便于配置和后期维护,强烈建议开通远程登录权限(如***授权),这样能大大提高效率;

 分配足够可使用的ip地址。

注意事项

 部署监控服务器端时,确保ip设置唯一,不要与其它主机的ip产生冲突;

 被监控端部署NRPE时,需征得相关人员同意;防火墙开放端口(如有启用)需得到支持后再往下进行;同时,不能因为安装引起业务中断。

附录:服务器配置要求

名称 规格型号 数量 备注

Cpu 志强2600系列 2颗 2台机器共四颗

内存 Ddr4 16G 64G 共8根

硬盘 Sas 15000转 600G 至少3块 共6块或者更多

电源 双电源 1 4个

更加体系化和实例化的proxmox超融合私有云实践系列文章,请移步本人专栏 “人人都能玩的私有云神器-proxmox”,猛戳此处,片刻直达!


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

当下的冲击

当下的冲击

道格拉斯•洛西科夫 (Douglas Rushkoff) / 孙浩 赵晖 / 中信出版社 / 2013-10-1 / 59.00元

这是一个并不符合人本能的社会…… 为什么我们不应该更注重生活的质量而非速度? 为什么我们不用面对面的交流代替冷冰冰电脑屏幕上的文字代码? 为什么我们不可以选择一个虽然有缺陷但有血有肉的人类社会,而非一个虽趋于完美但冷漠的数字世界? 在当下的冲击面前,你正变得越来越弱智:你没有了自己的独特空间,你过多地相信真人秀节目,你成了数字化产品的奴隶并得了数字化精神病,你的生物钟也被打......一起来看看 《当下的冲击》 这本书的介绍吧!

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具