搭建 Telegraf + InfluxDB + Grafana 监控遇到几个小问题

栏目: 服务器 · 发布时间: 5年前

内容简介:1:如果同一台服务器上安装有多个MongoDB实例,单个实例配置错误的多实例配置(例如两个实例);

1:如果同一台服务器上安装有多个 MongoDB 实例, telegraf .conf 中关于 MongoDB 如何配置? 配置数据在【INPUT PLUGINS的[[inputs.mongodb]]】部分。

单个实例配置

servers = ["mongodb://UID:PWD@XXX.XXX.XXX.124:27218"]

错误的多实例配置(例如两个实例);

   servers = ["mongodb://UID:PWD@XXX.XXX.XXX.124:27218"]
   servers = ["mongodb://UID:PWD@XXX0.XXX.XXX.124:27213"]

重启服务,查看服务状态,提示错误信息如下;

Failed to start The plugin-driven server agent for reporting metrics into InfluxDB.

搭建 Telegraf + InfluxDB + Grafana 监控遇到几个小问题

正确的配置应该为;

servers = ["mongodb://UID:PWD@XXX.XXX.XXX.124:27213","mongodb://UID:PWD@XXX.XXX.XXX.124:27218"]

2.配置Grafana告警规则后,发现只是告警一次,后面恢复后再报警一次。即异常持续期间没有一直告警。

解决办法,这个设置其实在【 Alterting 】--》【 Notification channels 】-->【Send reminders】

搭建 Telegraf + InfluxDB + Grafana 监控遇到几个小问题

例如以下的设置可以理解为,每5分钟触发一下告警信息。

搭建 Telegraf + InfluxDB + Grafana 监控遇到几个小问题

3.告警检查显示没有数据。

搭建 Telegraf + InfluxDB + Grafana 监控遇到几个小问题

这个时候有两种原因

(1)收集监控项的代理程序有 问题

(2)或者是代理程序没 问题 ,是汇报数据不及时的 问题

针对第二 问题 ,我们可以调整代理程序执行频率;如果实时性要求不是很高,还可以调整告警规则检查数据的时间范围。

例如,我们可以从检查 过去5分钟到过去1分钟内的数据,调整为过去10分钟到过去5分钟内的数据。对应的设置如下:

调整前;

搭建 Telegraf + InfluxDB + Grafana 监控遇到几个小问题

调整后

搭建 Telegraf + InfluxDB + Grafana 监控遇到几个小问题

4.随着需要监控的子项的增多,收集时间必然增多,需要调整运行周期。

否则,报错信息如下;

telegraf[2908]: 2019-03-01T02:40:46Z E! Error in plugin [inputs.mysql]: took longer to collect than collection interval (10s)

解决方案:调整 telegraf .conf 文件中 [agent] 部分的interval参数。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

新零售:低价高效的数据赋能之路

新零售:低价高效的数据赋能之路

刘润 / 中信出版集团 / 2018-9 / 65.00元

小米新零售,如何做到20倍坪效? 天猫小店,如何利用大数据助力线下零售? 盒马鲜生,为什么坚持必须用App才能买单? 名创优品,实体小店在电商冲击下,如何拥抱春天? 新零售的未来在何方?什么样的思维模式才可应对? 新零售,不是商界大佬的专用名词,它就在我们生活触手可及的各个角落——小到便利店的酸奶,大到京东商城的冰箱,都蕴含着消费者、货物、经营场所三者共同作用的经济逻......一起来看看 《新零售:低价高效的数据赋能之路》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器