可观测性工程
Charity Majors, Liz Fong-Jones, George Miranda
观测云团队 译
出版时间:2023年07月
页数:245
“对于任何想理解软件系统可观测性的人来说,这是一本清晰明了的指南。本书是所有业内人士的必读佳作!”
—— Alex Hidalgo
NobI9首席可靠性顾问,Implementing Service Level Objectives一书的作者

可观测性对于构建、更改和理解驱动复杂现代系统的软件至关重要。应用可观测性的团队能够快速、从容地发布代码,识别异常值和异常行为,并了解每个用户的体验。本书解释了可观测系统的价值,并展示了如何通过实践可观测性来驱动软件开发工程。
来自Honeycomb公司的三位作者解释了良好的可观测性由哪些要素构成,展示了如何利用可观测性改进现有的工作,并结合具体案例阐释了实施可观测性面临的常见挑战及有效解决方案,提供了从传统工具(如度量工具、监控工具和日志管理工具)迁移的实际注意事项,还解释了可观测性与组织文化的相互影响。
学完本书,你将了解:
● 可观测性概念如何应用于大规模软件管理。
● 在交付复杂的云原生应用和系统时实践可观测性的价值。
● 可观测性对整个软件开发生命周期的影响。
● 不同职能团队如何以及为什么在SLO(服务水平目标)中使用可观测性。
● 如何测试代码以帮助未来的工程师理解你今天编写的代码。
● 如何为上下文感知的系统调试和系统维护生成高质量的代码。
● 数据丰富的分析如何帮助你调试难以捉摸的问题。
  1. 前言
  2. 第一部分 可观测性的路径
  3. 第1章 什么是可观测性
  4. 1.1 可观测性的数学定义
  5. 1.2 把可观测性应用到软件系统
  6. 1.3 关于软件可观测性的错误描述
  7. 1.4 为什么现在可观测性很重要
  8. 1.5 使用指标进行调试与使用可观测性进行调试的对比
  9. 1.6 使用可观测性进行调试
  10. 1.7 可观测性适用于现代系统
  11. 1.8 结论
  12. 第2章 可观测性和监控之间的调试实践有何不同
  13. 2.1 监控数据如何用于调试
  14. 2.2 可观测性如何实现更好的调试
  15. 2.3 结论
  16. 第3章 不通过可观测性扩展系统的经验教训
  17. 3.1 关于Parse的介绍
  18. 3.2 Parse的扩展实践
  19. 3.3 向现代系统演进
  20. 3.4 向现代化实践变革
  21. 3.5 在Parse的转变实践
  22. 3.6 结论
  23. 第4章 可观测性与DevOps、SRE和云原生的关联
  24. 4.1 云原生、DevOps和SRE简介
  25. 4.2 可观测性:调试方式的过去与现在
  26. 4.3 可观测性增强了DevOps和SRE的实践
  27. 4.4 结论
  28. 第二部分 可观测性基础
  29. 第5章 结构化事件—可观测性的构建块
  30. 5.1 通过结构化事件进行调试
  31. 5.2 指标作为构建块的局限性
  32. 5.3 传统日志作为构建块的局限性
  33. 5.4 在调试中有用的事件属性
  34. 5.5 结论
  35. 第6章 将事件拼接成链路
  36. 6.1 分布式链路追踪及其重要性
  37. 6.2 链路追踪的组件
  38. 6.3 硬编码探针构建链路追踪
  39. 6.4 将自定义字段添加到链路span
  40. 6.5 将事件拼接到链路中
  41. 6.6 结论
  42. 第7章 遵照OpenTelemetry的探针
  43. 7.1 探针简介
  44. 7.2 开源探针标准
  45. 7.3 使用基于代码的示例的探针
  46. 7.4 结论
  47. 第8章 通过事件分析实现可观测性
  48. 8.1 从已有条件调试
  49. 8.2 从第一性原理调试
  50. 8.3 AIOps的误导性承诺
  51. 8.4 结论
  52. 第9章 可观测性和监控的融合
  53. 9.1 监控适合的地方
  54. 9.2 可观测性适合的地方
  55. 9.3 系统与软件注意事项
  56. 9.4 评估你的组织需求
  57. 9.5 结论
  58. 第三部分 团队的可观测性
  59. 第10章 在团队中应用可观测性实践
  60. 10.1 参与社区
  61. 10.2 从最大的痛点着手
  62. 10.3 购买代替自建
  63. 10.4 反复完善你的探针
  64. 10.5 温和改进,积极复用
  65. 10.6 全力冲刺
  66. 10.7 结论
  67. 第11章 可观测性驱动开发
  68. 11.1 测试驱动开发
  69. 11.2 软件开发生命周期中的可观测性
  70. 11.3 从哪里开始调试
  71. 11.4 微服务时代的调试
  72. 11.5 探针如何提高可观测性
  73. 11.6 可观测性左移
  74. 11.7 利用可观测性加快软件交付
  75. 11.8 结论
  76. 第12章 使用SLO来提高可靠性
  77. 12.1 传统监控方法造成危险的告警疲劳
  78. 12.2 阈值告警只适用于“已知的未知”情况
  79. 12.3 用户体验是一颗北极星
  80. 12.4 什么是SLO
  81. 12.5 结论
  82. 第13章 处理和调试基于SLO的告警
  83. 13.1 在错误预算消耗完之前发出告警
  84. 13.2 将时间定义成一个滑动窗口
  85. 13.3 预见性地创建预测消耗告警
  86. 13.4 使用SLO与时间序列数据的可观测性数据
  87. 13.5 结论
  88. 第14章 可观测性与软件供应链
  89. 14.1 为什么Slack需要可观测性
  90. 14.2 探针:共享客户端库和维度
  91. 14.3 案例研究:软件供应链的运营
  92. 14.4 结论
  93. 第四部分 大规模可观测性
  94. 第15章 自建与购买以及投资回报率
  95. 15.1 如何分析可观测性的投资回报率
  96. 15.2 自建的真实成本
  97. 15.3 购买软件的真实成本
  98. 15.4 购买与自建不是二元选择
  99. 15.5 结论
  100. 第16章 高效的数据存储
  101. 16.1 可观测性的功能要求
  102. 16.2 案例研究:Honeycomb的列式数据存储实现
  103. 16.3 结论
  104. 第17章 如何使采样精准且便宜
  105. 17.1 使用采样策略来优化数据采集
  106. 17.2 使用不同的采样策略
  107. 17.3 将采样策略转化为代码
  108. 17.4 结论
  109. 第18章 使用流水线进行遥测管理
  110. 18.1 遥测流水线的属性
  111. 18.2 管理一个遥测流水线:解剖
  112. 18.3 管理遥测流水线时的挑战
  113. 18.4 用例:Slack的遥测管理
  114. 18.5 开源替代方案
  115. 18.6 管理遥测流水线:自建与购买
  116. 18.7 结论
  117. 第五部分 传播可观测性文化
  118. 第19章 可观测性的商业案例
  119. 19.1 被动引入变更的方法
  120. 19.2 可观测性的投资回报
  121. 19.3 主动引入变更的方法
  122. 19.4 将可观测性引入实践
  123. 19.5 使用合适的工具
  124. 19.6 知道何时你有足够的可观测性
  125. 19.7 结论
  126. 第20章 可观测性利益相关方和联盟  
  127. 20.1 识别非工程可观测性需求
  128. 20.2 在实践中创建可观测性同盟
  129. 20.3 使用可观测性与商业智能工具
  130. 20.4 在实践中结合使用可观测性和商业智能工具
  131. 20.5 结论
  132. 第21章 可观测性成熟度模型
  133. 21.1 关于成熟度模型的说明
  134. 21.2 为什么可观测性需要成熟度模型
  135. 21.3 关于可观测性成熟度模型
  136. 21.4 可观测性成熟度模型中的能力参考
  137. 21.5 在你的组织中使用可观测性成熟度模型
  138. 21.6 结论
  139. 第22章 未来发展趋势
  140. 22.1 可观测性的过去与现在
  141. 22.2 其他资源
  142. 22.3 可观测性发展方向的预测
书名:可观测性工程
译者:观测云团队 译
国内出版社:机械工业出版社
出版时间:2023年07月
页数:245
书号:978-7-111-72909-9
原版书书名:Observability Engineering: Achieving Production Excellence
原版书出版商:O'Reilly Media
Charity Majors
 
夏丽蒂·梅杰斯(Charity Majors)是Honeycomb公司联合创始人和CTO,曾任Facebook生产工程经理,是一位有15年以上经验的高级系统工程师。
 
 
Liz Fong-Jones
 
Liz Fong-Jones是一名开发者顾问和SRE(站点可靠性工程师),拥有超过17年的经验。她是Honeycomb公司的SRE和可观测性社区的倡导者。
 
 
George Miranda
 
George Miranda曾是Honeycomb公司的系统工程师、产品营销员和GTM负责人。此前,他在金融和视频游戏行业拥有超过15年的构建大型分布式系统的经验。
 
 
购买选项
定价:109.00元
书号:978-7-111-72909-9
出版社:机械工业出版社