机器学习应用系统设计
刘继红 译
出版时间:2018年12月
页数:242
对于软件工程师,机器学习已经成为了一种常用术语。本书从“实用”的观点,介绍了如何将机器学习或数据分析的方法和工具应用到实际工作中,以及如何推进仍具有高度不确定性的机器学习项目等方法。本书主要围绕项目启动、系统构成、学习资源收集等经常关注的实践性问题进行阐述。如果你想做出些有显示度的人工智能应用系统的话,从本书学到的知识一定能够发挥积极的作用。
本书的主要内容有:
● 机器学习项目流程。
● 机器学习的用途。
● 学习结果的评价。
● 机器学习系统的开发。
● 机器学习资源的收集。
● 效果验证。
● 电影推荐系统。
● Kickstarter的数据分析。
● 基于Uplift Modeling的营销资源效率分析。
- 前言
- 第一部分
- 第1章 机器学习项目流程
- 1.1 如何利用机器学习
- 1.2 机器学习项目的流程
- 1.3 实际系统中的机器学习问题的处理方法
- 1.4 机器学习系统的成功要素
- 1.5 小结
- 第2章 机器学习的用途
- 2.1 算法选择
- 2.2 分类
- 2.3 回归
- 2.4 聚类与降维
- 2.5 其他
- 2.6 小结
- 第3章 学习结果的评价
- 3.1 分类的评价矩阵
- 3.2 回归的评价
- 3.3 机器学习系统的A/B测试
- 3.4 小结
- 第4章 机器学习系统的开发
- 4.1 机器学习系统的开发流程
- 4.2 系统设计
- 4.3 日志设计
- 4.4 小结
- 第5章 机器学习资源的收集
- 5.1 机器学习资源的获取
- 5.2 利用公开的数据集或模型
- 5.3 开发者自己创建训练数据
- 5.4 他人帮忙输入数据
- 5.5 数据创建众包
- 5.6 基于服务的用户输入
- 5.7 小结
- 第6章 效果验证
- 6.1 效果验证概述
- 6.2 假设检验的框架
- 6.3 假设检验的注意事项
- 6.4 因果效应的推断
- 6.5 A/B测试
- 6.6 小结
- 第二部分
- 第7章 电影推荐系统
- 7.1 概述
- 7.2 推荐系统功能
- 7.3 MovieLens的数据趋势
- 7.4 推荐系统的开发
- 7.5 小结
- 第8章 Kickstarter的数据分析
- 8.1 Kickstarter的API
- 8.2 Kickstarter的网络爬虫
- 8.3 数据变换
- 8.4 浏览Excel数据
- 8.5 数据透视表
- 8.6 达成目标却被取消的项目
- 8.7 国别的项目分析
- 8.8 形成分析报告
- 8.9 进一步的工作
- 8.10 小结
- 第9章 基于Uplift Modeling的营销资源效率分析
- 9.1 Uplift Modeling的四象限分区
- 9.2 扩展A/B测试的Uplift Modeling的概要
- 9.3 Uplift Modeling的数据集生成
- 9.4 利用两个预测模型的Uplift Modeling
- 9.5 Uplift Modeling的评价方法
- 9.6 实际应用
- 9.7 实际应用Uplift Modeling的相关事项
- 9.8 小结
- 参考文献
- 后记
- 致谢
书名:机器学习应用系统设计
译者:刘继红 译
国内出版社:中国电力出版社
出版时间:2018年12月
页数:242
书号:978-7-5198-2620-8
原版书书名:Machine Learning at work
原版书出版商:O'Reilly Japan
有贺康顕
曾任职电机制造公司研究所、餐饮服务公司,现在Cloudera任职。作为现场数据科学家,从事数据利用、机器学习咨询服务工作。
● https://twitter.com/chezou
● https://www.slideshare.net/chezou
● https://chezo.uno/
中山心太
曾任职电信公司研究所、社交游戏公司、机器学习网络营销公司、自由职业者。目前创建株式会社Next Int。除了本公司的服务开发外,也承接游戏开发企划、机器学习应用等业务。
机器学习、游戏设计、商业设计、新业务企划等,广泛业务均可胜任。
● https://twitter.com/tokoroten
● https://www.slideshare.net/TokorotenNakayama
● https://medium.com/@tokoroten/
西林孝
软件工程师。曾担任系统集成咨询个体工作者、任职软件开发公司,目前任职于株式会社VOYAGE GROUP。从事互联网广告服务的广告发送系统的开发。
● https://hagino3000.blogspot.jp/
● https://speakerdeck.com/hagino3000
● https://twitter.com/hagino3000
作者介绍
有贺康顕 曾任职电机制造公司研究所、餐饮服务公司,现在Cloudera任职。作为现场数据科学家,从事数据利用、机器学习咨询服务工作。
https://twitter.com/chezou
https://www.slideshare.net/chezou
https://chezo.uno/
中山心太 曾任职电信公司研究所、社交游戏公司、机器学习网络营销公司、自由职业者。目前创建株式会社Next Int。除了本公司的服务开发外,也承接游戏开发企划、机器学习应用等业务。
机器学习、游戏设计、商业设计、新业务企划等,广泛业务均可胜任。
https://twitter.com/tokoroten
https://www.slideshare.net/TokorotenNakayama
https://medium.com/@tokoroten/
西林孝 软件工程师。曾担任系统集成咨询个体工作者、任职软件开发公司,目前任职于株式会社VOYAGE GROUP。从事互联网广告服务的广告发送系统的开发。
https://hagino3000.blogspot.jp/
https://speakerdeck.com/hagino3000
https://twitter.com/hagino3000
封面介绍
本书封面上的动物是大犰狳(Giant armadillo),是贫齿目犰狳科大犰狳属的唯一一种哺乳类动物。
生活在南美的从热带稀树草原到热带雨林的广泛区域,过着地栖生活,属夜行性动物。感到危险时会藏身于洞穴中,难以被发现。最大身长150cm,体重可达50kg。体两侧和四肢外侧覆盖着骨板与鳞板,鳞板其实是演变成鳞片状的体毛。说到犰狳,便会联想到身体蜷缩成球状,以防御天敌侵害。但是,大犰狳并非如此。
栖息在森林里或周边的草原上,喜欢靠近水边。主要食物是白蚁,蚂蚁和其他昆虫,以及蜘蛛、蜥蜴、蛇、动物腐肉、植物等也是它的食物。用前肢挖掘蚁穴或地面,食用地下食物。因被当做可食用动物而被捕猎,数量激减,濒临灭绝。在国际自然保护联盟(IUCN)的红色名录上,被列为濒临灭绝II类(易危)动物。