大型监控系统设计与应用实践

案例来源:京东云
会议地点:深圳
分享时间: 2019-06-21 15:50-16:50

郑永宽  |

京东云 产品研发部总监

2012年硕士毕业于华中科技大学,先后任职于百度、京东。毕业后一直从事自动化运维领域相关工作,现任京东云产品研发部工具产品研发总监,构建了京东云自动化运维平台云翼,推动了京东云运维向自动化、平台化转变,期间历经多次618与双11大促考验。并成功推进平台产品化,服务于京东云广大企业级客户。

课程概要

【案例背景介绍】
1、监控遗漏频发,导致后于用户发现问题
2、报警泛滥,导致运维人员受干扰验证,同时容易遗漏关键报警
3、问题定位困难,止损准备不足,导致MTTR长

【解决思路/成功要点】
1、丰富数据采集手段
2、高可用监控系统设计
3、统一监控标准与模型
4、监控打分与配置推荐

【成果】
监控系统的设计与应用,应该以保障业务稳定性为前提。监控的实践,是一个追求卓越的过程

听众收益

1、了解企业级监控难点于对应的解决方案
2、作为监控系统开发者,了解大型监控系统设计的关键问题
3、作为企业运维人员,了解监控实践方法论,了解监控如何加"全"的问题,从而能够确保及时发现问题,进一步快速定位故障,结合预案解决问题

郑永宽  |

京东云
产品研发部总监

2012年硕士毕业于华中科技大学,先后任职于百度、京东。毕业后一直从事自动化运维领域相关工作,现任京东云产品研发部工具产品研发总监,构建了京东云自动化运维平台云翼,推动了京东云运维向自动化、平台化转变,期间历经多次618与双11大促考验。并成功推进平台产品化,服务于京东云广大企业级客户。

课程概要

【案例背景介绍】
1、监控遗漏频发,导致后于用户发现问题
2、报警泛滥,导致运维人员受干扰验证,同时容易遗漏关键报警
3、问题定位困难,止损准备不足,导致MTTR长

【解决思路/成功要点】
1、丰富数据采集手段
2、高可用监控系统设计
3、统一监控标准与模型
4、监控打分与配置推荐

【成果】
监控系统的设计与应用,应该以保障业务稳定性为前提。监控的实践,是一个追求卓越的过程

听众收益

1、了解企业级监控难点于对应的解决方案
2、作为监控系统开发者,了解大型监控系统设计的关键问题
3、作为企业运维人员,了解监控实践方法论,了解监控如何加"全"的问题,从而能够确保及时发现问题,进一步快速定位故障,结合预案解决问题

CopyRight © 2008-2019 Msup & 高可用架构