AI工程:大模型应用开发实战
AI工程:大模型应用开发实战
Chip Huyen
宝玉 译
出版时间:2026年02月
页数:373
“这本书结构清晰、内容详尽,全面涵盖了构建生成式AI系统的核心要素。对于致力于在企业内部实现AI规模化落地的专业人士而言,这是一本必读之作。”
——Vittorio Cretella
宝洁(P&G)与玛氏(Mars)前全球首席信息官
“Chip Huyen深谙生成式AI的精髓,更是一位杰出的教师与作家,她的工作切实帮助了无数团队将AI成功投入生产环境。基于其丰富的实战经验,Chip打造了一部全景式指南,对在生产环境中设计与部署AI应用所需的一切,进行了精辟入里的阐述。”
——Luke Metz
ChatGPT共同创造者、OpenAI前研究经理

基础模型不仅解锁了海量全新的AI应用场景,更大幅降低了构建AI产品的门槛。AI已不再是高深的小众学科,而成为一种人人可用的强大的开发工具——即便是零基础的开发者也能轻松驾驭。
本书深入浅出,系统地介绍了“AI工程”——基于现成的基础模型构建AI应用的方法,为AI应用开发者提供了一张在复杂的AI生态中穿行的导航图,涵盖模型、数据集、评估基准以及层出不穷的应用模式。此外,书中还引入了一套从开发到高效部署的实战框架,助你打造高质量的AI应用。
通过本书,你将学习以下内容:
● 深刻理解AI工程的内涵及其与传统机器学习工程的异同。
● 掌握开发AI应用的完整流程,熟悉每一阶段的挑战及应对策略。
● 探索包括提示工程、RAG、微调、智能体及数据集工程在内的
多种模型适配技术,并理解其机制与适用场景。
● 深入剖析基础模型服务中的延迟与成本瓶颈,学习切实可行
的优化方法。
● 根据业务需求选择合适的模型、评估指标、数据及开发模式。
  1. 对本书的赞誉(中文版)
  2. 对本书的赞誉(英文版)
  3. 译者序
  4. 中文版序
  5. 前言
  6. 第1章 基于基础模型构建AI应用入门
  7. 1.1 AI工程的兴起
  8. 1.1.1 从语言模型到大语言模型
  9. 1.1.2 从大语言模型到基础模型
  10. 1.1.3 从基础模型到AI工程
  11. 1.2 基础模型的应用场景
  12. 1.2.1 编程
  13. 1.2.2 图像和视频制作
  14. 1.2.3 写作
  15. 1.2.4 教育
  16. 1.2.5 聊天机器人
  17. 1.2.6 信息聚合
  18. 1.2.7 数据组织
  19. 1.2.8 工作流自动化
  20. 1.3 规划AI应用
  21. 1.3.1 应用场景评估
  22. 1.3.2 设定目标
  23. 1.3.3 里程碑规划
  24. 1.3.4 维护
  25. 1.4 AI工程技术栈
  26. 1.4.1 AI工程技术栈的三层结构
  27. 1.4.2 AI工程与ML工程
  28. 1.4.3 AI工程与全栈工程
  29. 1.5 小结
  30. 第2章 理解基础模型
  31. 2.1 训练数据
  32. 2.1.1 多语言模型
  33. 2.1.2 领域特定模型
  34. 2.2 建模
  35. 2.2.1 模型架构
  36. 2.2.2 模型规模
  37. 2.3 后训练
  38. 2.3.1 监督微调
  39. 2.3.2 偏好微调
  40. 2.4 采样
  41. 2.4.1 采样基础知识
  42. 2.4.2 采样策略
  43. 2.4.3 推理时计算
  44. 2.4.4 结构化输出
  45. 2.4.5 AI 的概率特性
  46. 2.5 小结
  47. 第3章 评估方法论
  48. 3.1 评估基础模型的挑战
  49. 3.2 理解语言建模指标
  50. 3.2.1 熵
  51. 3.2.2 交叉熵
  52. 3.2.3 BPC与BPB
  53. 3.2.4 困惑度
  54. 3.2.5 困惑度的解释与应用场景
  55. 3.3 精确评估
  56. 3.3.1 功能正确性
  57. 3.3.2 与参考数据的相似度度量
  58. 3.3.3 嵌入简介
  59. 3.4 AI当裁判
  60. 3.4.1 为什么用AI当裁判
  61. 3.4.2 如何用AI当裁判
  62. 3.4.3 AI当裁判的局限性
  63. 3.4.4 哪些模型可以作为裁判
  64. 3.5 使用比较评估对模型进行排名
  65. 3.5.1 比较评估面临的挑战
  66. 3.5.2 比较评估的未来
  67. 3.6 小结
  68. 第4章 评估AI系统
  69. 4.1 评估标准
  70. 4.1.1 领域特定能力
  71. 4.1.2 生成能力
  72. 4.1.3 指令遵循能力
  73. 4.1.4 成本和延迟
  74. 4.2 模型选择
  75. 4.2.1 模型选择工作流
  76. 4.2.2 模型的自建与购买
  77. 4.2.3 利用公开基准测试
  78. 4.3 设计你的评估流水线
  79. 4.3.1 步骤1:评估系统中的所有组件
  80. 4.3.2 步骤2:创建评估指南
  81. 4.3.3 步骤3:定义评估方法和数据
  82. 4.4 小结
  83. 第5章 提示工程
  84. 5.1 提示词简介
  85. 5.1.1 上下文学习:零样本和少样本
  86. 5.1.2 系统提示词和用户提示词
  87. 5.1.3 上下文长度与上下文效率
  88. 5.2 提示工程最佳实践
  89. 5.2.1 撰写清晰、明确的指令
  90. 5.2.2 提供充足的上下文
  91. 5.2.3 将复杂任务拆分为更简单的子任务
  92. 5.2.4 给模型更多思考时间
  93. 5.2.5 对提示词进行迭代优化
  94. 5.2.6 评估提示工程工具
  95. 5.2.7 提示词的组织与版本管理
  96. 5.3 防御性提示工程
  97. 5.3.1 专有提示词与逆向提示工程
  98. 5.3.2 越狱与提示词注入
  99. 5.3.3 信息提取
  100. 5.3.4 针对提示词攻击的防御措施
  101. 5.4 小结
  102. 第6章 RAG与智能体
  103. 6.1 RAG
  104. 6.1.1 RAG 架构
  105. 6.1.2 检索算法
  106. 6.1.3 检索优化
  107. 6.1.4 超越文本的RAG
  108. 6.2 智能体
  109. 6.2.1 智能体概述
  110. 6.2.2 工具
  111. 6.2.3 规划
  112. 6.2.4 智能体的故障模式与评估
  113. 6.3 记忆
  114. 6.4 小结
  115. 第7章 微调
  116. 7.1 微调概述
  117. 7.2 何时进行微调
  118. 7.2.1 进行微调的原因
  119. 7.2.2 不进行微调的原因
  120. 7.2.3 微调与RAG
  121. 7.3 内存瓶颈
  122. 7.3.1 反向传播与可训练参数
  123. 7.3.2 内存计算
  124. 7.3.3 数值表示
  125. 7.3.4 量化
  126. 7.4 微调技术
  127. 7.4.1 PEFT
  128. 7.4.2 模型合并与多任务微调
  129. 7.4.3 微调策略
  130. 7.5 小结
  131. 第8章 数据集工程
  132. 8.1 数据策展
  133. 8.1.1 数据质量
  134. 8.1.2 数据覆盖度
  135. 8.1.3 数据量
  136. 8.1.4 数据获取与数据标注
  137. 8.2 数据增强与数据合成
  138. 8.2.1 为什么要进行数据合成
  139. 8.2.2 传统的数据合成方法
  140. 8.2.3 A 驱动的数据合成方法
  141. 8.2.4 模型蒸馏
  142. 8.3 数据处理
  143. 8.3.1 数据检查
  144. 8.3.2 数据去重
  145. 8.3.3 数据清理与过滤
  146. 8.3.4 数据格式化
  147. 8.4 小结
  148. 第9章 推理优化
  149. 9.1 理解推理优化
  150. 9.1.1 推理概述
  151. 9.1.2 推理性能指标
  152. 9.1.3 AI加速器
  153. 9.2 推理优化的实现
  154. 9.2.1 模型优化
  155. 9.2.2 推理服务优化
  156. 9.3 小结
  157. 第10章 AI工程架构与用户反馈
  158. 10.1 AI工程架构
  159. 10.1.1 增强上下文
  160. 10.1.2 设置防护措施
  161. 10.1.3 添加路由器和模型网关
  162. 10.1.4 通过缓存技术降低延迟
  163. 10.1.5 添加智能体模式
  164. 10.1.6 监控与可观测性
  165. 10.1.7 AI流水线编排
  166. 10.2 用户反馈
  167. 10.2.1 提取对话反馈
  168. 10.2.2 反馈设计
  169. 10.2.3 反馈的局限性
  170. 10.3 小结
  171. 后记
书名:AI工程:大模型应用开发实战
作者:Chip Huyen
译者:宝玉 译
国内出版社:人民邮电出版社
出版时间:2026年02月
页数:373
书号:978-7-115-68639-8
原版书书名:AI Engineering
原版书出版商:O'Reilly Media
Chip Huyen
 
Chip Huyen是实时机器学习平台Claypot AI的联合创始人。凭借在 NVIDIA、Netflix和Snorkel Al的工作,她帮助了一些世界上最大的组织开发和部署机器学习系统。本书是Chip根据她在斯坦福大学开设的课程“机器学习系统设计”(CS329S)的讲义撰写的。
 
 
本书封面上的动物是漠林鸮(Strix butleri),一种原产于阿曼、伊朗和阿联酋的“无耳鸮”。
1878年,一种鸮以其发现者——鸟类学家Edward Arthur Butler的名字被命名为Strix butleri。这种鸟通常被称为休谟鸮,曾被认为广泛分布于整个中东地区。
2013年,人们在阿曼发现了一种此前未知的鸮,并将其命名为Strix omanensis。当时科研人员并未采集到实体样本,仅根据照片和声音记录进行了描述。2015年,科研人员对Strix butleri的正模标本(1878年发现的原始标本)进行分析后发现,Strix butleri与Strix omanensis实际上是同一物种,并且不同于中东地区更为常见的鸮类。根据命名规则,Strix omanensis这一名称被修订为最初的名称Strix butleri,而此前被命名为Strix butleri的更常见的鸮类则被重新命名为Strix hadorami。
漠林鸮的面部呈浅灰色和深灰色,眼睛为橙色。上体羽毛为深灰褐色,下体为浅灰色并带有细窄的深色条纹。这是一种中等体型的鸮,头部圆润,没有耳羽簇。由于该物种是相对较新的发现,鸟类学家仍在研究其行为、生态和分布情况。
漠林鸮在IUCN(世界自然保护联盟)的保护状态为LC(无危)。
购买选项
定价:159.80元
书号:978-7-115-68639-8
出版社:人民邮电出版社