柯振旭 |
Tetrate 可观测性工程师
现 Tetrate 可观测性工程师。前阿里巴巴 SRE 工程师。Apache SkyWalking 核心维护者及项目管理委员会成员。专注于微服务系统及其可观测性,以及在云原生场景下的可观测性。
课程概要
案例背景:
Kubernetes 集群几乎时刻都在产生事件,这些事件中包含的关键信息可能是后续线上故障的主要原因,而这部分事件通常不容易与故障指标进行关联。本案例将详细介绍 Apache SkyWalking 如何将 Kubernetes 产生的事件与 SkyWalking 本身的监控指标进行关联分析,帮助用户快速定位故障原因。
解决思路:
解决方案通过利用 skywalking-kubernetes-event-exporter 监听 Kubernetes 事件,对事件进行提纯、收集、发送至 SkyWalking 后端进行分析和存储,配合 SkyWalking 收集的系统指标,能够快速发现 Kubernetes 产生的事件所影响的系统指标。
成果:
达到预期。Kubernetes 产生的事件中,影响系统指标的事件能够从 Apache SkyWalking 的指标仪表盘上面直观反映出来,帮助 SRE 工程师快速判断系统指标/故障产生的原因,实现快速恢复。
听众收益
1. 学习了解 Apache SkyWalking 在云原生场景下提供的强大的可观测性能力。
2. 学习利用 Kubernetes 事件来辅助分析系统故障和提供系统告警。
3. 获得使用 Apache SkyWalking 和 Kubernetes Event Exporter 进行系统监控最佳实践。
柯振旭 |
Tetrate
可观测性工程师
现 Tetrate 可观测性工程师。前阿里巴巴 SRE 工程师。Apache SkyWalking 核心维护者及项目管理委员会成员。专注于微服务系统及其可观测性,以及在云原生场景下的可观测性。
课程概要
案例背景:
Kubernetes 集群几乎时刻都在产生事件,这些事件中包含的关键信息可能是后续线上故障的主要原因,而这部分事件通常不容易与故障指标进行关联。本案例将详细介绍 Apache SkyWalking 如何将 Kubernetes 产生的事件与 SkyWalking 本身的监控指标进行关联分析,帮助用户快速定位故障原因。
解决思路:
解决方案通过利用 skywalking-kubernetes-event-exporter 监听 Kubernetes 事件,对事件进行提纯、收集、发送至 SkyWalking 后端进行分析和存储,配合 SkyWalking 收集的系统指标,能够快速发现 Kubernetes 产生的事件所影响的系统指标。
成果:
达到预期。Kubernetes 产生的事件中,影响系统指标的事件能够从 Apache SkyWalking 的指标仪表盘上面直观反映出来,帮助 SRE 工程师快速判断系统指标/故障产生的原因,实现快速恢复。
听众收益
1. 学习了解 Apache SkyWalking 在云原生场景下提供的强大的可观测性能力。
2. 学习利用 Kubernetes 事件来辅助分析系统故障和提供系统告警。
3. 获得使用 Apache SkyWalking 和 Kubernetes Event Exporter 进行系统监控最佳实践。