Ray分布式机器学习:利用Ray进行大模型的数据处理、训练、推理和部署(让分布式AI触手可及)
Max Pumperla, Edward Oakes, Richard Liaw
沈冲 译
出版时间:2024年05月
页数:238
“这是一本关于Ray分布式计算框架的上乘技术书籍,作者是Ray的三位主要贡献者,将分布式计算和机器学习化繁为简,优雅地分解为一系列简单易懂的示例。”
——Patrick Ames
亚马逊工程主管
“这是一本将分布式系统应用于机器学习的权威书籍,也是一本使用Jupyter notebook构建大规模分布式数据应用程序的入门读物。”
——Mark Saroufim
Meta PyTorch团队的人工智能应用工程师

Ray是开源分布式计算框架,简化了扩展计算密集型Python工作负载的过程。通过本书,Python程序员、数据工程师和数据科学家将学会如何在本地利用Ray并启动计算集群。你将能够使用Ray来大规模构建和运行机器学习程序。
三位作者展示了如何使用Ray构建机器学习应用程序。你将了解Ray如何融入当前的机器学习工具,并了解Ray与这些工具紧密集成的方法。分布式计算很难,但Ray让一切困难迎刃而解。
通过学习本书,你将:
● 了解如何使用Ray Core构建分布式应用程序。
● 使用Ray Tune进行超参数优化。
● 使用Ray RLlib库进行强化学习。
● 使用Ray Train库管理分布式训练。
● 使用Ray Datasets进行数据处理。
● 了解如何使用Ray Clusters以及如何使用Ray Serve为模型提供服务。
● 使用Ray AIR创建端到端机器学习应用程序。
  1. 前言
  2. 第1章 Ray概述
  3. 1.1 Ray是什么
  4. 1.1.1 Ray的渊源
  5. 1.1.2 Ray的设计原则
  6. 1.1.3 Ray的三层架构:内核、库、生态
  7. 1.2 分布式计算框架
  8. 1.3 数据科学库套件
  9. 1.3.1 Ray AIR和数据科学工作流
  10. 1.3.2 处理数据
  11. 1.3.3 训练模型
  12. 1.3.4 调优超参数
  13. 1.3.5 部署模型
  14. 1.4 Ray的生态
  15. 1.5 总结
  16. 第2章 Ray Core入门
  17. 2.1 Ray Core简介
  18. 2.1.1 Ray API的第一个示例
  19. 2.1.2 Ray Core API概述
  20. 2.2 理解Ray的系统组件
  21. 2.2.1 在节点上调度和执行任务
  22. 2.2.2 主节点
  23. 2.2.3 分布式调度和执行
  24. 2.3 利用Ray创建简单的MapReduce示例
  25. 2.3.1 映射和打乱文档数据
  26. 2.3.2 利用约简进行单词统计
  27. 2.4 总结
  28. 第3章 创建第一个分布式应用程序
  29. 3.1 强化学习入门
  30. 3.2 创建简易的迷宫问题
  31. 3.3 创建模拟
  32. 3.4 训练强化学习模型
  33. 3.5 创建分布式Ray应用程序
  34. 3.6 回顾强化学习术语
  35. 3.7 总结
  36. 第4章 利用Ray RLlib进行强化学习
  37. 4.1 RLlib概述
  38. 4.2 RLlib入门
  39. 4.2.1 创建Gym环境
  40. 4.2.2 运行RLlib CLI
  41. 4.2.3 使用RLlib Python API
  42. 4.3 配置RLlib实验
  43. 4.3.1 资源配置
  44. 4.3.2 配置rollout worker
  45. 4.3.3 配置环境
  46. 4.4 使用RLlib环境
  47. 4.4.1 RLlib环境概述
  48. 4.4.2 使用多智能体
  49. 4.4.3 使用策略服务器和客户端
  50. 4.5 高级概念
  51. 4.5.1 创建高级环境
  52. 4.5.2 应用课程学习
  53. 4.5.3 使用离线数据
  54. 4.5.4 其他高级主题
  55. 4.6 总结
  56. 第5章 利用Ray Tune进行超参数调优
  57. 5.1 调优超参数
  58. 5.1.1 使用Ray创建随机搜索示例
  59. 5.1.2 调优超参数的难点
  60. 5.2 Ray Tune入门
  61. 5.2.1 Tune的原理
  62. 5.2.2 配置和运行Tune
  63. 5.3 使用Tune进行机器学习
  64. 5.3.1 结合使用RLlib和Tune
  65. 5.3.2 调优Keras模型
  66. 5.4 总结
  67. 第6章 利用Ray进行数据处理
  68. 6.1 Ray Dataset
  69. 6.1.1 Ray Dataset基础
  70. 6.1.2 利用Ray Dataset进行计算
  71. 6.1.3 数据集管道
  72. 6.1.4 示例:并行训练分类器副本
  73. 6.2 外部集成库
  74. 6.3 创建ML管道
  75. 6.4 总结
  76. 第7章 利用Ray Train进行分布式训练
  77. 7.1 分布式模型训练基础
  78. 7.2 基于示例介绍Ray Train
  79. 7.2.1 预测纽约出租车的大额小费
  80. 7.2.2 加载、预处理、特征化
  81. 7.2.3 定义深度学习模型
  82. 7.2.4 示例:利用Ray Train进行分布式训练
  83. 7.2.5 分布式批量推理
  84. 7.3 Ray Train训练器
  85. 7.3.1 迁移到Ray Train
  86. 7.3.2 扩展训练器
  87. 7.3.3 利用Ray Train进行预处理
  88. 7.3.4 将训练器和Ray Tune集成
  89. 7.3.5 使用回调函数监控训练
  90. 7.4 总结
  91. 第8章 利用Ray Serve进行在线推理
  92. 8.1 在线推理的主要特点
  93. 8.1.1 ML模型属于计算密集型
  94. 8.1.2 ML模型无法独立使用
  95. 8.2 Ray Serve入门
  96. 8.2.1 Ray Serve概述
  97. 8.2.2 定义基础HTTP端点
  98. 8.2.3 扩展和资源分配
  99. 8.2.4 批处理请求
  100. 8.2.5 多模型推理图
  101. 8.3 端到端示例:创建基于NLP的API
  102. 8.3.1 获取内容和预处理
  103. 8.3.2 NLP模型
  104. 8.3.3 HTTP处理和驱动逻辑
  105. 8.3.4 整合
  106. 8.4 总结
  107. 第9章 Ray集群
  108. 9.1 手动创建Ray Cluster
  109. 9.2 在Kubernetes上进行部署
  110. 9.2.1 设置KubeRay集群
  111. 9.2.2 与KubeRay集群交互
  112. 9.2.3 公开KubeRay
  113. 9.2.4 配置KubeRay
  114. 9.2.5 配置KubeRay日志
  115. 9.3 使用Ray集群启动器
  116. 9.3.1 配置Ray集群
  117. 9.3.2 使用集群启动器CLI
  118. 9.3.3 与Ray Cluster交互
  119. 9.4 使用云集群
  120. 9.4.1 AWS
  121. 9.4.2 其他云服务
  122. 9.5 自动扩展
  123. 9.6 总结
  124. 第10章 Ray AIR入门
  125. 10.1 为什么使用AIR
  126. 10.2 AIR核心概念
  127. 10.2.1 Ray Dataset和预处理器
  128. 10.2.2 训练器
  129. 10.2.3 调优器和检查点
  130. 10.2.4 批预测器
  131. 10.2.5 部署
  132. 10.3 适合AIR的任务
  133. 10.3.1 AIR任务执行
  134. 10.3.2 AIR内存管理
  135. 10.3.3 AIR故障模型
  136. 10.3.4 自动扩展AIR任务
  137. 10.4 总结
  138. 第11章 Ray生态及其他
  139. 11.1 蓬勃的生态
  140. 11.1.1 数据加载和处理
  141. 11.1.2 模型训练
  142. 11.1.3 模型服务
  143. 11.1.4 创建自定义集成
  144. 11.1.5 Ray集成概述
  145. 11.2 Ray和其他系统
  146. 11.2.1 分布式Python框架
  147. 11.2.2 Ray AIR和更广泛的ML生态
  148. 11.2.3 将AIR集成到ML平台
  149. 11.3 继续学习
  150. 11.4 总结
书名:Ray分布式机器学习:利用Ray进行大模型的数据处理、训练、推理和部署(让分布式AI触手可及)
译者:沈冲 译
国内出版社:机械工业出版社
出版时间:2024年05月
页数:238
书号:978-7-111-75338-4
原版书书名:Learning Ray
原版书出版商:O'Reilly Media
Max Pumperla
 
Max Pumperla是数据科学家,还是Anyscale的软件工程师。
 
 
Edward Oakes
 
Edward Oakes是Anyscale的软件工程师和团队负责人。
 
 
Richard Liaw
 
Richard Liaw是Anyscale的软件工程师。
 
 
购买选项
定价:99.00元
书号:978-7-111-75338-4
出版社:机械工业出版社