问题发现定位

栏目: 服务器 · Nginx · 发布时间: 6年前

内容简介:问题发现定位平台功能点需要全面,实现大多基于日志(收集多KAFKA,分布式存储),日志检索(多采用ES)。链路分析再次基础上做采样聚合,接口级别的非采样在监控中做(时间流存储,监控报警阈值模型智能预测等),日志针对性做些细粒度的链路分析。技术涉及不多,主要是日志压缩和索引的建设。功能点成体系就好。本文重点关注这个。更多工程内容见:1.nginxtraceid当前由几部分组成:(nginx的ip) + (生成的时间) + (生成id的nginx的启动时间 + 生成id的nginx的进程号)+(循环自增id +

问题发现定位平台功能点需要全面,实现大多基于日志(收集多KAFKA,分布式存储),日志检索(多采用ES)。链路分析再次基础上做采样聚合,接口级别的非采样在监控中做(时间流存储,监控报警阈值模型智能预测等),日志针对性做些细粒度的链路分析。技术涉及不多,主要是日志压缩和索引的建设。功能点成体系就好。本文重点关注这个。更多工程内容见: https://segmentfault.com/a/11...

日志规范。定则规范

全链路传递

1.nginx

traceid当前由几部分组成:(nginx的ip) + (生成的时间) + (生成id的nginx的启动时间 + 生成id的nginx的进程号)+(循环自增id + 末两位固定02)

nginx扩展+http header传递

2.thrift

利用thrift 0号位空缺作为header使用

3.mq ??

问题发现:

问题发现定位

1.odin实时监控,阈值报警。(接口维度,机器维度)

2.woater实时监控,智能报警

3.srm灭火图/上线事件监控

4.安全扫描

问题定位

问题发现定位

5.故障分析平台(全链路故障点)

6.问题分析平台(搜索:ES)

kafka+ES

详细日志查询:大量debug/trace等日志。取代机器+grep:ES获取机器索引时间+日志压缩/解压缩,时间定位查询

7.性能分析(抽样)

业务评估

问题发现定位

1.机器调用关系

2.服务依赖关系(静态),次数(统计)

链路分析,延时(采样平均),调用次数(静态,动态采样)

3.模块性能分析(采样统计)

4.专项(mysql,定位到代码和人)

成本管理

问题发现定位

1.资源成本统计

2.实时资源占用监控

整体解决思路

问题发现定位

问题发现定位


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

HTML5秘籍(第2版)

HTML5秘籍(第2版)

[美] Matthew MacDonald / 李松峰、朱巍、刘帅 / 人民邮电出版社 / 2015-4 / 89.00元

不依赖插件添加音频和视频,构建适用于所有浏览器的播放页面。 用Canvas创建吸引人的视觉效果,绘制图形、图像、文本,播放动画,运行交互游戏。 用CSS3将页面变活泼,比如添加新奇的字体,利用变换和动画添加吸引人的效果。 设计更出色的Web表单,利用HTML5新增的表单元素更加高效地收集访客信息。 一次开发,多平台运行,实现响应式设计,创建适配桌面计算机、平板电脑和智能手机......一起来看看 《HTML5秘籍(第2版)》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器