专题:高可用架构
混沌工程的实验理论在 2017 年被 Netflix 及相关团队提出,目标是希望通过在生产环境周期性引入故障的方式,验证系统对非预期故障防御的有效性。相比于被动的应对故障,在可控的影响下实施混沌工程实验,提前揭示系统弱点,可以增强我们对系统可恢复性的信心。混沌工程属于一个新兴的技术领域,行业认知和实践积累比较少,大多数IT团队对它的理解还没有上升到一个领域概念。本次专题我们将从多方面对这一新兴领域做出解读。
本专题下的议题
混沌工程在分布式数据库领域的实践
周强 PingCAP 基础工具团队负责人
所属专题:高可用架构
课程概要
案例背景:
2019 年 12 月 31 号我们开源了 Chaos Mesh 混沌测试平台,并于 2020 年 7 月 15 日进入 CNCF Sandbox。在内部我们使用该平台提前发现了很多严重的 bug,平时也可使用该平台做故障演练或模拟特定的开发环境。Chaos Mesh 是在 K8s 上进行混沌工程的一体化解决方案
成功要点:
我们开发了 Chaos Mesh 分布式混沌测试平台,该平台依托于 k8s 基础设施,通过对 pod/container 进行诸如杀节点、IO 错误和延时注入、时间回退、内核分配内存失败等等来进行混沌测试,能够很大的提升我们分布式数据库的稳健程度。
成果:
我们使用 Chaos Mesh 提前发现了诸多 bug. 同时我们开源了分布式混沌平台 Chaos Mesh,目前已有 1.5k star. Chaos Mesh 是 K8s 上进行混沌测试的一体化解决方案
听众收益
1.首先分享在云上数据库的挑战,观众可以直观的感受云上数据库构建的不易
2.介绍混沌工程的使用经验和踩过的坑,观众后续可以通过混沌工程来进行相关实践
3.介绍 Chaos Mesh 的使用场景和客户案例,可以帮助大家更好的理解混沌工程的使用场景并为大家的混沌工程实践增加经验
基于Envoy的高性能API 网关开发落地实践
曾宇星 网易 资深架构师
所属专题:高可用架构
课程概要
业务服务迁移到Kuberneters 集群上,对应流量入口是基于传统的Api网关还是 K8s Ingress 方案,面临两难选择。 网易集团内部,各个业务部门对应Api gateway 需求、选型是多样性的,同时,各个业务部门对研发成本和资源控制在新时期也有了新的目标;在此大背景下,我们希望在集团内部,能够打造一款在满足业务扩展需求的同时,同时能提供技术栈相对统一的、稳定可靠的、高性能的网关服务;
听众收益
1、微服务k8s部署场景下的网关选择遇到的问题
2、熟悉Envoy 的主体功能点,可扩展性,如何快速扩展添加插件功能
3、如何针对Envoy 做性能调优
基于云服务构建基础架构高可用
刘勇 腾讯云 腾讯云技术专家
所属专题:高可用架构
课程概要
案例背景:
过去几年里云计算在中国这片土地快速生根发芽,涌现出了一批优秀的云计算业务实践者和高品质的云服务提供商。在诸多上云用户的实践过程中,基础架构的高可用能力,直接关系着云上服务的稳定性。所以如何结合自身业务场景,使用好云高可用能力成为了上云过程中的一个重要话题。
解决思路:
本次分享将从云高可用能力出发,展示基于云的高可用基础架构组织方式,以及云上部署的最佳实现方式。
听众收益
1. 了解云上高可用构建思路
2. 如何基于云上高可用能力,构建合适自身业务的基础高可用架构
3. 典型高可用云产品的使用案例
从多云架构的IM云服务看架构的伸缩性设计
一乐 美信拓扑 CEO
所属专题:高可用架构
课程概要
案例背景:
IM私有云技术复杂涉及点多,使得私有云部署和实施效率不高,而这也意味着更高的成本和价格,很多中小客户需求无法满足。如何提高部署效率并降低成本,低价格满足用户需求的同时,提高自身的利润率,是一个不小的挑战。
解决思路:
我们的目标是,使用同一套技术栈满足公有云和私有云,并要求服务本身有足够的伸缩性可以应对千万级用户同时在线,又能够快速部署私有云。
主要有两个措施,1)引入以K8S为主的云原生技术,解决了IM服务多集群(上千集群)通讯部署问题;2)如何选择架构模式满足系统对伸缩性的要求;
成果:
美信拓扑IM云服务完成上线,千万级同时在线的公有云和十分钟部署的私有云使用同样的技术栈,IM 私有云达到行业价格十分之一,还可以按月订阅付费。
听众收益
1. 了解多云架构的 IM 云服务;
2. 了解不同架构模式对设计的影响以及如何选择;
3. 了解以 IM 私有云快速部署的实践经验;
即时通讯专家,十余年即时通讯IM经验,在高并发高可用服务架构方面有丰富的积累,成功开发过多个千万级用户同时在线的系统。
美信拓扑创始人。美信拓扑做的是一键启用多云架构的即时通讯云服务。借助快速发展的云原生技术,提供十分钟安装的行业价格十分之一的IM私有云服务。
在此之前,他是环信云通讯事业部总经理、首席架构师,也曾是新浪微博通讯技术专家,负责新浪微博IM平台的技术管理,以及微博平台研发架构委员会。
平时积极参与技术社区的分享与交流,有公众号「一乐来了」。
专题:高可用架构
混沌工程的实验理论在 2017 年被 Netflix 及相关团队提出,目标是希望通过在生产环境周期性引入故障的方式,验证系统对非预期故障防御的有效性。相比于被动的应对故障,在可控的影响下实施混沌工程实验,提前揭示系统弱点,可以增强我们对系统可恢复性的信心。混沌工程属于一个新兴的技术领域,行业认知和实践积累比较少,大多数IT团队对它的理解还没有上升到一个领域概念。本次专题我们将从多方面对这一新兴领域做出解读。
其他相关专题
-
智能运维
专题出品人:杨锦涛(Osier Yang)
腾讯科技 专家工程师
随着大数据、人工智能、云计算技术的日渐成熟和飞速发展,传统的运维技术和解决方案已经不能满足需求,智能运维已成为运维的热点领域。如何利用AI提升运维的能力和效率,是保障业务高可用所面临的最大挑战。
-
高可用架构
专题出品人: 一乐 (梁宇鹏)
美信拓扑 创始人兼CEO
混沌工程的实验理论在 2017 年被 Netflix 及相关团队提出,目标是希望通过在生产环境周期性引入故障的方式,验证系统对非预期故障防御的有效性。相比于被动的应对故障,在可控的影响下实施混沌工程实验,提前揭示系统弱点,可以增强我们对系统可恢复性的信心。混沌工程属于一个新兴的技术领域,行业认知和实践积累比较少,大多数IT团队对它的理解还没有上升到一个领域概念。本次专题我们将从多方面对这一新兴领域做出解读。
-
在线教育时代
专题出品人: 一乐 (梁宇鹏)
美信拓扑 创始人兼CEO
新冠疫情的出现,加速了整个在线教育、音视频直播行业的发展,多家公司加入了竞争,这种竞争的核心是比拼音视频技术的稳定性与高性能,合理利用最新技术与实践应用,才能帮助立于在线教育时长的不败之地。
-
大中台
专题出品人:谢纯良
阿里巴巴 阿里云原生应用平台架构总监
2019年被称为中台元年,技术上说的“中台”主要是指学习发源自美军的这种高效、灵活和强大的指挥作战体系。但是中台究竟应该如何做,经过一年时间的沉淀,业界是否有低成本成功落地的方法论能够指导大家践行中台?