Kubeflow学习指南:生产级机器学习系统实现
Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko
狄卫华 译
出版时间:2022年01月
页数:228
如果你正在训练一个机器学习模型,但不确定如何将其投入生产,本书将协助你完成目标。Kubeflow为模型生命周期的不同阶段提供了一系列云原生工具,从数据探索和特征准备到模型训练和模型服务。本书可以帮助数据科学家用Kubeflow构建生产级机器学习实现,并向数据工程师展示了如何使模型具有可伸缩性和可靠性。
作者使用书中的示例解释了如何使用Kubeflow在云端或者本地开发环境中的Kubernetes上训练机器学习模型并为模型提供服务。
本书将帮助你:
● 理解Kubeflow的设计、核心组件和所能解决的问题。
● 使用Kubeflow和流行的工具(包括scikit-learn、TensorFlow和Apache Spark)训练模型。
● 使用Kubeflow流水线使模型保持最新状态。
● 了解如何获取模型训练的元数据。
● 为超参调优进行训练。
● 了解如何在生产中为模型提供服务。
● 探索如何用其他开源工具扩展Kubeflow。
  1. 序言
  2. 前言
  3. 第1章 Kubeflow及其适用对象
  4. 1.1 模型开发生命周期
  5. 1.2 Kubeflow适合什么场景
  6. 1.3 为什么需要容器化
  7. 1.4 为什么需要 Kubernetes
  8. 1.5 Kubeflow的设计和核心组件
  9. 1.6 Kubeflow的替代方案
  10. 1.7 案例研究
  11. 1.8 总结
  12. 第2章 你好,Kubeflow
  13. 2.1 搭建Kubeflow
  14. 2.2 训练和部署模型
  15. 2.3 超越本地部署
  16. 2.4 总结
  17. 第3章 Kubeflow设计:超越基础
  18. 3.1 中央仪表盘
  19. 3.2 支持组件
  20. 3.3 总结
  21. 第4章 Kubeflow Pipeline
  22. 4.1 Pipeline入门
  23. 4.2 Kubeflow Pipeline组件介绍
  24. 4.3 Pipeline高级主题
  25. 4.4 总结
  26. 第5章 数据准备和特征准备
  27. 5.1 选择正确的工具
  28. 5.2 本地数据准备和特征准备
  29. 5.3 分布式工具
  30. 5.4 将其整合到一个Pipeline中
  31. 5.5 将整个notebook作为数据准备Pipeline阶段使用
  32. 5.6 总结
  33. 第6章 制品和元数据存储
  34. 6.1 Kubeflow ML Metadata
  35. 6.2 基于Kubeflow的MLflow元数据工具
  36. 6.3 总结
  37. 第7章 训练机器学习模型
  38. 7.1 用TensorFlow构建推荐器
  39. 7.2 部署TensorFlow训练作业
  40. 7.3 分布式训练
  41. 7.4 使用scikit-learn训练模型
  42. 7.5 总结
  43. 第8章 模型推断
  44. 8.1 模型服务
  45. 8.2 模型监控
  46. 8.3 模型更新
  47. 8.4 推理要求概述
  48. 8.5 Kubeflow中的模型推理
  49. 8.6 TensorFlow Serving
  50. 8.7 Seldon Core
  51. 8.8 KFServing
  52. 8.9 总结
  53. 第9章 多工具使用案例
  54. 9.1 CT扫描去噪示例
  55. 9.2 共享Pipeline
  56. 9.3 总结
  57. 第10章 超参调优和自动化机器学习
  58. 10.1 AutoML概述
  59. 10.2 使用Kubeflow Katib进行超参调优
  60. 10.3 Katib概念
  61. 10.4 安装Katib
  62. 10.5 运行第一个Katib实验
  63. 10.6 调优分布式训练作业
  64. 10.7 神经网络架构搜索
  65. 10.8 Katib的优势
  66. 10.9 总结
  67. 附录A Argo执行器配置和权衡
  68. 附录B 特定于云的工具和配置
  69. 附录C 在应用程序中使用模型服务
书名:Kubeflow学习指南:生产级机器学习系统实现
译者:狄卫华 译
国内出版社:机械工业出版社
出版时间:2022年01月
页数:228
书号:978-7-111-69937-8
原版书书名:Kubeflow for Machine Learning
原版书出版商:O'Reilly Media
Trevor Grant
 
Trevor Grant是Apache Mahout的PMC主席。
 
 
Holden Karau
 
Holden Karau是一位加拿大人,在IBM的Spark技术中心担任软件开发工程师。同时作为一位Spark committer,经常在PySpark和机器学习方面进行贡献。另外曾在多次国际会议中发表关于Spark的演讲。
Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速数据处理》。
 
 
Boris Lublinsky
 
Boris Lublinsky是Lightbend的首席架构师。
 
 
Richard Liu
 
Richard Liu是Waymo的一名高级软件工程师。
 
 
Ilan Filonenko
 
Ilan Filonenko是Bloomberg数据科学基础设施团队的一名软件工程师