机器学习流水线实战
孔晓泉, 郑炜, 江骏 译
出版时间:2021年11月
页数:276
正如自动化流水线给汽车制造业带来了质的改变,自动化机器学习流水线也能从根本上加速机器学习领域的发展。机器学习流水线实现了复用、管理和部署机器学习模型的标准化流程。数据科学家和机器学习工程师不仅能摆脱逐个手动构建和训练模型的 “作坊式” 工作流程,还能产出更可靠、更安全的模型。
本书带领你使用TensorFlow生态圈中的众多工具构建可复现的机器学习流水线,从而将模型部署时间从数天缩短为数分钟,有效地实现机器学习项目产品化。你将学习如下内容。
● 了解机器学习流水线的构建步骤
● 使用TensorFlow Extended(TFX)构建机器学习流水线
● 使用Beam、Airflow、Kubeflow Pipelines编排流水线
● 数据校验和数据预处理
● 使用TensorFlow的模型分析工具
● 检查模型的公平性
● 使用TensorFlow Serving和TensorFlow Lite部署模型
● 了解差分隐私、联邦学习和加密机器学习等隐私保护方法
书名:机器学习流水线实战
译者:孔晓泉, 郑炜, 江骏 译
国内出版社:人民邮电出版社
出版时间:2021年11月
页数:276
书号:978-7-115-57321-6
原版书书名:Building Machine Learning Pipelines
原版书出版商:O'Reilly Media
Hannes Hapke
汉内斯·哈普克(Hannes Hapke),数据科学家,善于解决各行各业的机器学习问题,与他人合著有《自然语言处理实战》。
Catherine Nelson
凯瑟琳·纳尔逊(Catherine Nelson),数据科学家,牛津大学硕士,长期
为企业提供机器学习解决方案。