混沌工程:复杂系统韧性实现之道
Casey Rosenthal, Nora Jones
吾真本, 黄帅 译
出版时间:2021年07月
页数:256
随着越来越多的公司转向构建微服务及其他形式的分布式系统,这些系统的复杂性也与日俱增。虽然无法消除复杂性,但通过实践混沌工程,可以发现系统中的漏洞,并防患于未然。本书向工程师展示了如何在优化系统满足业务目标的同时应对复杂的系统。
两位作者是该领域的杰出人物,他们在Netflix公司合作期间开创了“混沌工程”这一学科。在本书中,他们不仅阐述了混沌工程 的目标、方法和价值,还促进了各行业的从业者针对该主题展开交流。本书内容丰富,立足于发展史,面向未来,是打开混沌工 程之门的黄金之钥。
通过阅读本书,你将:
● 了解混沌工程如何使组织能够应对复杂性。
● 探索一种方法来快速应对和修复未知的应用程序、网络和基础设 施的故障。
● 通过谷歌、微软、Slack和LinkedIn等行业专家的真实故事,学习 如何将理论应用于实践。
● 建立思考软件系统内部复杂性的框架。
● 围绕Game Day设计一个混沌工程实施计划,并朝着目标明确的自动化实验方向发展。
● 了解如何设计能够实现持续协作的混沌实验。
  1. 前言
  2. 导言:混沌工程的诞生
  3. 第一部分 搭建舞台
  4. 第1章 遇到复杂系统
  5. 1.1 思考复杂性
  6. 1.2 遇到复杂性
  7. 1.3 面对复杂性
  8. 1.4 接纳复杂性
  9. 第2章 应对复杂系统
  10. 2.1 动态安全模型
  11. 2.2 复杂性的经济支柱模型
  12. 2.3 系统化视角
  13. 第3章 原则概述
  14. 3.1 混沌工程是什么
  15. 3.2 混沌工程不是什么
  16. 3.3 高级原则
  17. 3.4 原则的未来
  18. 第二部分 投入实战
  19. 第4章 Slack的灾难剧场
  20. 4.1 旧系统的混沌工程改造
  21. 4.2 灾难剧场
  22. 4.3 混沌工程的过程
  23. 4.4 过程如何演化
  24. 4.5 获得管理层支持
  25. 4.6 结果
  26. 4.7 总结
  27. 第5章 谷歌DiRT:灾难恢复测试
  28. 5.1 DiRT测试的生命周期
  29. 5.2 谷歌的测试范围
  30. 5.3 总结
  31. 第6章 微软的多样化故障和实验优先级
  32. 6.1 为什么一切都如此复杂
  33. 6.2 实验结果的类别
  34. 6.3 故障优先级
  35. 6.4 多样化的程度
  36. 6.5 大规模部署实验
  37. 6.6 总结
  38. 第7章 LinkedIn心中有会员
  39. 7.1从灾难中学习
  40. 7.2 细化实验目标
  41. 7.3 安全地进行大规模实验
  42. 7.4 LinkedOut实战
  43. 7.5 总结
  44. 第8章 采纳并演进混沌工程的第一资本金融公司
  45. 8.1 第一资本金融公司案例研究
  46. 8.2 设计实验时需要注意的事项
  47. 8.3 工具链
  48. 8.4 团队结构
  49. 8.5 传播
  50. 8.6 总结
  51. 第三部分 人为因素
  52. 第9章 先见之明
  53. 9.1 混沌工程与韧性
  54. 9.2 混沌工程的步骤
  55. 9.3 混沌工程实验的工具支持
  56. 9.4 有效的内部合作
  57. 9.5 总结
  58. 第10章 人类系统的混沌
  59. 10.1 系统中的人
  60. 10.2 工程师团队的适应能力
  61. 10.3 付诸实践
  62. 第11章 决策圈中的人
  63. 11.1 实验的原因、方法和时机
  64. 11.2 总结
  65. 第12章 实验选择问题及解决方案
  66. 12.1 选择实验
  67. 12.2 可观测性:机会来了
  68. 12.3 总结
  69. 第四部分 商业因素
  70. 第13章 混沌工程的投资回报率
  71. 13.1 减少事故所带来的好处转瞬即逝
  72. 13.2 Kirkpatrick模型
  73. 13.3 投资回报率替代方案示例
  74. 13.4 附带投资回报率
  75. 13.5 总结
  76. 第14章 将心态、科学和混沌开放
  77. 14.1 协作心态
  78. 14.2 开放科学与开放源代码
  79. 14.3 总结
  80. 第15章 混沌成熟度模型
  81. 15.1 采用度
  82. 15.2 复杂性
  83. 15.3 总结
  84. 第五部分 持续演进
  85. 第16章 持续验证
  86. 16.1 持续验证从何而来
  87. 16.2 持续验证系统的类型
  88. 16.3 持续验证示例:ChAP
  89. 16.4 持续验证的未来用例
  90. 第17章 介入信息物理系统
  91. 17.1 信息物理系统的兴起
  92. 17.2 功能安全遇上混沌工程
  93. 17.3 信息物理系统的软件
  94. 17.4 混沌工程超越FMEA
  95. 17.5 探针效应
  96. 17.6 总结
  97. 第18章 当HOP遇上混沌工程
  98. 18.1 什么是HOP
  99. 18.2 HOP的主要原则
  100. 18.3 HOP遇上混沌工程
  101. 18.4 总结
  102. 第19章 数据库的混沌工程
  103. 19.1 为什么我们需要混沌工程
  104. 19.2 应用混沌工程
  105. 19.3 检测故障
  106. 19.4 自动化混沌工程
  107. 19.5 总结
  108. 第20章 安全混沌工程的案例
  109. 20.1 现代安全手段
  110. 20.2 安全混沌工程与现有方法
  111. 20.3 安全Game Day
  112. 20.4 安全混沌工程工具示例:ChaoSlingr
  113. 20.5 总结
  114. 第21章 结语
书名:混沌工程:复杂系统韧性实现之道
译者:吾真本, 黄帅 译
国内出版社:机械工业出版社
出版时间:2021年07月
页数:256
书号:978-7-111-68273-8
原版书书名:Chaos Engineering: System Resiliency in Practice
原版书出版商:O'Reilly Media
Casey Rosenthal
 
Casey Rosenthal是Verica公司的首席执行官兼联合创始人。他曾是Netflix公司混沌工程团队的工程经理,在使用分布式系统、人工智能以及将新颖的算法和学术界知识转化为能落地的模型方面拥有丰富的经验。
 
 
Nora Jones
 
Nora Jones是Jeli公司的首席执行官兼联合创始人。她是一位敬业且充满自驱力的技术领导者和软件工程 师,对分布式系统中人与软件的协同工作充满热情。她在2017年AWS re:Invent大会的主题演讲中为混沌工程运动的发起做出了贡献。
 
 
购买选项
定价:119.00元
书号:978-7-111-68273-8
出版社:机械工业出版社