内容简介:Telegraf是TICK Stack的一部分,是一个插件驱动的服务器代理,用于收集和报告指标。 Telegraf集成了直接从其运行的容器和系统中提取各种指标,事件和日志,从第三方API提取指标,甚至通过StatsD和Kafka消费者服务监听指标。它还具有输出插件,可将指标发送到各种其他数据存储,服务和消息队列,包括InfluxDB,Graphite,OpenTSDB,Datadog,Librato,Kafka,MQTT,NSQ等等。聆听翻译 InfluxDB用作涉及大量带时间戳数据的任何用例的数据存储,
Telegraf+Infludb+Grafana构建可视化监控系统
telegraf介绍
Telegraf是TICK Stack的一部分,是一个插件驱动的服务器代理,用于收集和报告指标。 Telegraf集成了直接从其运行的容器和系统中提取各种指标,事件和日志,从第三方API提取指标,甚至通过StatsD和Kafka消费者服务监听指标。它还具有输出插件,可将指标发送到各种其他数据存储,服务和消息队列,包括InfluxDB,Graphite,OpenTSDB,Datadog,Librato,Kafka,MQTT,NSQ等等。
telegraf部署
$ wget https://dl.influxdata.com/telegraf/releases/telegraf-1.7.3_linux_amd64.tar.gz $ tar xf telegraf-1.7.3_linux_amd64.tar.gz
telegraf配置及优化
[global_tags] [agent] interval = "10s" round_interval = true metric_batch_size = 1000 metric_buffer_limit = 10000 collection_jitter = "0s" flush_interval = "10s" flush_jitter = "0s" precision = "" debug = false quiet = false logfile = "" hostname = "192.168.1.1" omit_hostname = false [[outputs.influxdb]] urls = ["http://192.168.1.1:8086"] database = "telegraf" precision = "s" timeout = "5s" username = "monitor" password = "EMZ1LdVUu0pMXbkaoPzpCO9S1J2bqvPi" [[inputs.cpu]] percpu = true totalcpu = true collect_cpu_time = false report_active = false [[inputs.disk]] ignore_fs = ["tmpfs", "devtmpfs", "devfs"] [[inputs.diskio]] [[inputs.kernel]] [[inputs.mem]] [[inputs.processes]] [[inputs.swap]] [[inputs.system]] [[inputs.netstat]] [[inputs.net]] interfaces = ["eth0"] #[[inputs.zookeeper]] # servers = ["192.168.1.1:2181"]
telegraf启动
$ nohup /usr/local/telegraf/usr/bin/telegraf --config /usr/local/telegraf/etc/telegraf/telegraf.conf &
infludb介绍
聆听翻译 InfluxDB用作涉及大量带时间戳数据的任何用例的数据存储,包括DevOps监控,日志数据,应用程序指标,物联网传感器数据和实时分析。通过配置InfluxDB来保存机器上的空间,以便将数据保留一段定义的时间,自动使系统中不需要的数据到期和删除。 InfluxDB还提供类似 SQL 的查询语言,用于与数据交互。
infludb部署
$ wget https://dl.influxdata.com/influxdb/releases/influxdb-1.6.1_linux_amd64.tar.gz $ tar xvfz influxdb-1.6.1_linux_amd64.tar.gz
influbd启动
$ nohup /usr/local/influxdb/usr/bin/influxd &
创建数据库及配置权限
$ influx $ create database telegraf # 显示用户 $ SHOW USERS # 创建用户 $ CREATE USER "username" WITH PASSWORD 'password' # 创建管理员权限的用户 $ CREATE USER "username" WITH PASSWORD 'password' WITH ALL PRIVILEGES # 删除用户 $ DROP USER "username"
数据保存策略
查看当前数据库的Retention Policies
$ SHOW RETENTION POLICIES ON "testDB"
创建新的Retention Policies
$ CREATE RETENTION POLICY "rp_name" ON "db_name" DURATION 30d REPLICATION 1 DEFAULT
其中:
-
- rp_name:策略名
-
- db_name:具体的数据库名
-
- 30d:保存30天,30天之前的数据将被删除,它具有各种时间参数,比如:h(小时),w(星期)
-
- REPLICATION 1:副本个数,这里填1就可以了
-
- DEFAULT 设为默认的策略
修改Retention Policies
$ ALTER RETENTION POLICY "rp_name" ON "db_name" DURATION 3w DEFAULT
删除Retention Policies
$ DROP RETENTION POLICY "rp_name" ON "db_name"
最终效果
模板采用: https://grafana.com/dashboards/914
参考
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 使用prometheus + grafana + pushgateway搭建监控可视化系统
- 基于 HTML5 WebGL 的计量站三维可视化监控系统 Web 组态工控应用
- 【监控系统】配合Graphite使用的报警系统
- WGCLOUD 监控系统更新,集成 ES 在线监控工具
- 告警系统主脚本,告警系统配置文件,告警系统监控项目
- WGCLOUD 监控系统更新,进程监控模块 bug 修复
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。