柯振旭  |

Tetrate

可观测性工程师

即将开始的GIAC课程

使用 SkyWalking 监控 Kubernetes 事件

云原生

2021-07-31 15:50--16:50

案例背景:
Kubernetes 集群几乎时刻都在产生事件,这些事件中包含的关键信息可能是后续线上故障的主要原因,而这部分事件通常不容易与故障指标进行关联。本案例将详细介绍 Apache SkyWalking 如何将 Kubernetes 产生的事件与 SkyWalking 本身的监控指标进行关联分析,帮助用户快速定位故障原因。

解决思路:
解决方案通过利用 skywalking-kubernetes-event-exporter 监听 Kubernetes 事件,对事件进行提纯、收集、发送至 SkyWalking 后端进行分析和存储,配合 SkyWalking 收集的系统指标,能够快速发现 Kubernetes 产生的事件所影响的系统指标。

成果:
达到预期。Kubernetes 产生的事件中,影响系统指标的事件能够从 Apache SkyWalking 的指标仪表盘上面直观反映出来,帮助 SRE 工程师快速判断系统指标/故障产生的原因,实现快速恢复。

现 Tetrate 可观测性工程师。前阿里巴巴 SRE 工程师。Apache SkyWalking 核心维护者及项目管理委员会成员。专注于微服务系统及其可观测性,以及在云原生场景下的可观测性。

即将开始的GIAC课程

使用 SkyWalking 监控 Kubernetes 事件

云原生

2021-07-31 15:50--16:50

案例背景:
Kubernetes 集群几乎时刻都在产生事件,这些事件中包含的关键信息可能是后续线上故障的主要原因,而这部分事件通常不容易与故障指标进行关联。本案例将详细介绍 Apache SkyWalking 如何将 Kubernetes 产生的事件与 SkyWalking 本身的监控指标进行关联分析,帮助用户快速定位故障原因。

解决思路:
解决方案通过利用 skywalking-kubernetes-event-exporter 监听 Kubernetes 事件,对事件进行提纯、收集、发送至 SkyWalking 后端进行分析和存储,配合 SkyWalking 收集的系统指标,能够快速发现 Kubernetes 产生的事件所影响的系统指标。

成果:
达到预期。Kubernetes 产生的事件中,影响系统指标的事件能够从 Apache SkyWalking 的指标仪表盘上面直观反映出来,帮助 SRE 工程师快速判断系统指标/故障产生的原因,实现快速恢复。

CopyRight © 2008-2021 Msup & 高可用架构

京ICP备09001521号