Kubeflow学习指南:生产级机器学习系统实现
狄卫华 译
出版时间:2022年01月
页数:228
如果你正在训练一个机器学习模型,但不确定如何将其投入生产,本书将协助你完成目标。Kubeflow为模型生命周期的不同阶段提供了一系列云原生工具,从数据探索和特征准备到模型训练和模型服务。本书可以帮助数据科学家用Kubeflow构建生产级机器学习实现,并向数据工程师展示了如何使模型具有可伸缩性和可靠性。
作者使用书中的示例解释了如何使用Kubeflow在云端或者本地开发环境中的Kubernetes上训练机器学习模型并为模型提供服务。
本书将帮助你:
● 理解Kubeflow的设计、核心组件和所能解决的问题。
● 使用Kubeflow和流行的工具(包括scikit-learn、TensorFlow和Apache Spark)训练模型。
● 使用Kubeflow流水线使模型保持最新状态。
● 了解如何获取模型训练的元数据。
● 为超参调优进行训练。
● 了解如何在生产中为模型提供服务。
● 探索如何用其他开源工具扩展Kubeflow。
- 序言
- 前言
- 第1章 Kubeflow及其适用对象
- 1.1 模型开发生命周期
- 1.2 Kubeflow适合什么场景
- 1.3 为什么需要容器化
- 1.4 为什么需要 Kubernetes
- 1.5 Kubeflow的设计和核心组件
- 1.6 Kubeflow的替代方案
- 1.7 案例研究
- 1.8 总结
- 第2章 你好,Kubeflow
- 2.1 搭建Kubeflow
- 2.2 训练和部署模型
- 2.3 超越本地部署
- 2.4 总结
- 第3章 Kubeflow设计:超越基础
- 3.1 中央仪表盘
- 3.2 支持组件
- 3.3 总结
- 第4章 Kubeflow Pipeline
- 4.1 Pipeline入门
- 4.2 Kubeflow Pipeline组件介绍
- 4.3 Pipeline高级主题
- 4.4 总结
- 第5章 数据准备和特征准备
- 5.1 选择正确的工具
- 5.2 本地数据准备和特征准备
- 5.3 分布式工具
- 5.4 将其整合到一个Pipeline中
- 5.5 将整个notebook作为数据准备Pipeline阶段使用
- 5.6 总结
- 第6章 制品和元数据存储
- 6.1 Kubeflow ML Metadata
- 6.2 基于Kubeflow的MLflow元数据工具
- 6.3 总结
- 第7章 训练机器学习模型
- 7.1 用TensorFlow构建推荐器
- 7.2 部署TensorFlow训练作业
- 7.3 分布式训练
- 7.4 使用scikit-learn训练模型
- 7.5 总结
- 第8章 模型推断
- 8.1 模型服务
- 8.2 模型监控
- 8.3 模型更新
- 8.4 推理要求概述
- 8.5 Kubeflow中的模型推理
- 8.6 TensorFlow Serving
- 8.7 Seldon Core
- 8.8 KFServing
- 8.9 总结
- 第9章 多工具使用案例
- 9.1 CT扫描去噪示例
- 9.2 共享Pipeline
- 9.3 总结
- 第10章 超参调优和自动化机器学习
- 10.1 AutoML概述
- 10.2 使用Kubeflow Katib进行超参调优
- 10.3 Katib概念
- 10.4 安装Katib
- 10.5 运行第一个Katib实验
- 10.6 调优分布式训练作业
- 10.7 神经网络架构搜索
- 10.8 Katib的优势
- 10.9 总结
- 附录A Argo执行器配置和权衡
- 附录B 特定于云的工具和配置
- 附录C 在应用程序中使用模型服务
书名:Kubeflow学习指南:生产级机器学习系统实现
译者:狄卫华 译
国内出版社:机械工业出版社
出版时间:2022年01月
页数:228
书号:978-7-111-69937-8
原版书书名:Kubeflow for Machine Learning
原版书出版商:O'Reilly Media
Trevor Grant
Trevor Grant是Apache Mahout的PMC主席。
Holden Karau
Holden Karau是一位加拿大人,在IBM的Spark技术中心担任软件开发工程师。同时作为一位Spark committer,经常在PySpark和机器学习方面进行贡献。另外曾在多次国际会议中发表关于Spark的演讲。
Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速数据处理》。
Boris Lublinsky
Boris Lublinsky是Lightbend的首席架构师。
Richard Liu
Richard Liu是Waymo的一名高级软件工程师。
Ilan Filonenko
Ilan Filonenko是Bloomberg数据科学基础设施团队的一名软件工程师