LinkedAIOps根因溯源互联网落地案例分享

案例来源:Linkedsee灵犀
会议地点:深圳
分享时间: 2019-06-21 13:30-14:30

朱颖航  |

Linkedsee灵犀 AIOps平台事业部 Linkedsee灵犀合伙人

曾在百度系统部担任多年资深系统工程师,是百度“智能数据中心”项目的核心贡献人员,现任灵犀技术合伙人。在40W+服务器规模下,实现了从硬件数据采集,存储,分析和挖掘的全程经验,从而将服务器硬件监控带入细粒度覆盖,定位效能,自动治愈,提前预测的新时代,是服务器智能运维领域的绝对专家。 擅长AIOps产品规划、技术方案设计及落地实现,完成交付;

课程概要

【案例背景介绍】
经过长时间的客户调研和分析,当前互联网行业IT运维中存在着如下痛点:
1. 监控系统建设不完整:在出现问题时,现有的监控系统无法提供足够的排查问题的监控数据信息,很多监控点是在故障出现之后延迟补齐;
2. 告警噪声过多,散落在各个监控系统中:已有的告警信息包含大量的噪声,给日常的运维工作带来较大的负担,在出现故障时告警信息散落在各个监控系统中,需要通过专家在不同的监控系统之间人工进行整合,解决问题的速度受限于专家的知识和能力,处理效率有待提升;
3. 组织绩效和单点依赖的问题冲突问题:专家知识经验可以在问题排障的过程中发挥其价值,但专家本身的流动性会带来组织绩效和运维水平/能力波动的问题,需要寻求一种新的方式解决此二者的冲突。

【解决思路/成功要点】
基于运维大数据和人工智能技术,运用多种机器学习算法,在故障产生时通过指标异常检测、日志异常检测等算法及时感知故障,同时通过告警聚类、根因推荐、关联数据排查等快速定位故障,帮助企业解决运维故障管理中耗时较长(发现-定位)的问题,从而降低MTTR提升SLA 。

【成果】
目前本产品已经在互联网和银行业有了实际落地的案例,本次分享集中在互联网行业

听众收益

1.了解AIOps当前行业发展的现状和进展;
2. 了解Linkedaiops根因溯源产品逻辑;
3. 了解根因溯源实现的核心算法模型

朱颖航  |

Linkedsee灵犀
AIOps平台事业部 Linkedsee灵犀合伙人

曾在百度系统部担任多年资深系统工程师,是百度“智能数据中心”项目的核心贡献人员,现任灵犀技术合伙人。在40W+服务器规模下,实现了从硬件数据采集,存储,分析和挖掘的全程经验,从而将服务器硬件监控带入细粒度覆盖,定位效能,自动治愈,提前预测的新时代,是服务器智能运维领域的绝对专家。 擅长AIOps产品规划、技术方案设计及落地实现,完成交付;

课程概要

【案例背景介绍】
经过长时间的客户调研和分析,当前互联网行业IT运维中存在着如下痛点:
1. 监控系统建设不完整:在出现问题时,现有的监控系统无法提供足够的排查问题的监控数据信息,很多监控点是在故障出现之后延迟补齐;
2. 告警噪声过多,散落在各个监控系统中:已有的告警信息包含大量的噪声,给日常的运维工作带来较大的负担,在出现故障时告警信息散落在各个监控系统中,需要通过专家在不同的监控系统之间人工进行整合,解决问题的速度受限于专家的知识和能力,处理效率有待提升;
3. 组织绩效和单点依赖的问题冲突问题:专家知识经验可以在问题排障的过程中发挥其价值,但专家本身的流动性会带来组织绩效和运维水平/能力波动的问题,需要寻求一种新的方式解决此二者的冲突。

【解决思路/成功要点】
基于运维大数据和人工智能技术,运用多种机器学习算法,在故障产生时通过指标异常检测、日志异常检测等算法及时感知故障,同时通过告警聚类、根因推荐、关联数据排查等快速定位故障,帮助企业解决运维故障管理中耗时较长(发现-定位)的问题,从而降低MTTR提升SLA 。

【成果】
目前本产品已经在互联网和银行业有了实际落地的案例,本次分享集中在互联网行业

听众收益

1.了解AIOps当前行业发展的现状和进展;
2. 了解Linkedaiops根因溯源产品逻辑;
3. 了解根因溯源实现的核心算法模型

CopyRight © 2008-2019 Msup & 高可用架构