议题介绍
本次演讲主要分享蚂蚁集团混沌工程领域核心技术的演进与风险经验的沉淀。我们将介绍核心技术产品以及云原生实践,探讨混沌工程的演进方向;此外,我们还将站在混沌工程的视角对技术风险进行分类,以风险目录的形式进行描述,这对企业实施混沌工程具有很好的指导作用。
内容大纲
1. 简单引入,混沌工程是做什么的、对稳定性的价值,行业发展背景以及国内外发展阶段。
2. 蚂蚁集团混沌工程的组织实施形式、实践落地规模、产出价值、沉淀的可借鉴经验等。
a. 蚂蚁集团的落地形式:常态攻防演练+公司级集中大规模攻防演练、红蓝军人员组织安排、运营设计比如排名制奖惩制度等;
b. 混沌工程实践带来的风险挖掘数据成果;
c. 蚂蚁集团混沌工程的打法介绍:理论指导(风险目录)+技术支撑(ChaosMeta)。
3. 风险目录是什么?是蚂蚁集团在技术风险领域多年积累的方法论。
a. 风险目录有哪些大的模块分类:比如云原生、中间件、机房容灾、数据库、微服务、数据风险、端风险等;
b. 举一些普通关注的领域的例子:中间件、Kubernetes、Java业务应用。
4. ChaosMeta是什么?核心的产品能力+故障注入能力+强调特色能力
a. 产品能力-云原生注入架构的特点;
b. 故障注入能力-云原生领域注入能力的特点;
c. 怎么和风险目录结合?演进路线RoadMap:人工设计与配置=》自动化一键体检=》AI智能化;
d. ChaosMeta开源社区的分享与介绍。
听众收益
1. 蚂蚁集团在混沌工程领域的人员组织形式、运营运作方案给了企业落地混沌工程很好的参考价值;
2. ChaosMeta+风险目录结合的可落地技术方案给了企业实施混沌工程很好的参考价值;
3. 分享蚂蚁集团混沌工程的未来演进方向,如何为业务稳定性带来更大的价值,给企业带来评估混沌工程投入的参考。