机器学习应用系统设计
有贺康顕, 中山心太, 西林孝
刘继红 译
出版时间:2018年12月
页数:242
对于软件工程师,机器学习已经成为了一种常用术语。本书从“实用”的观点,介绍了如何将机器学习或数据分析的方法和工具应用到实际工作中,以及如何推进仍具有高度不确定性的机器学习项目等方法。本书主要围绕项目启动、系统构成、学习资源收集等经常关注的实践性问题进行阐述。如果你想做出些有显示度的人工智能应用系统的话,从本书学到的知识一定能够发挥积极的作用。
本书的主要内容有:
● 机器学习项目流程。
● 机器学习的用途。
● 学习结果的评价。
● 机器学习系统的开发。
● 机器学习资源的收集。
● 效果验证。
● 电影推荐系统。
● Kickstarter的数据分析。
● 基于Uplift Modeling的营销资源效率分析。
  1. 前言
  2. 第一部分
  3. 第1章 机器学习项目流程
  4. 1.1 如何利用机器学习
  5. 1.2 机器学习项目的流程
  6. 1.3 实际系统中的机器学习问题的处理方法
  7. 1.4 机器学习系统的成功要素
  8. 1.5 小结
  9. 第2章 机器学习的用途
  10. 2.1 算法选择
  11. 2.2 分类
  12. 2.3 回归
  13. 2.4 聚类与降维
  14. 2.5 其他
  15. 2.6 小结
  16. 第3章 学习结果的评价
  17. 3.1 分类的评价矩阵
  18. 3.2 回归的评价
  19. 3.3 机器学习系统的A/B测试
  20. 3.4 小结
  21. 第4章 机器学习系统的开发
  22. 4.1 机器学习系统的开发流程
  23. 4.2 系统设计
  24. 4.3 日志设计
  25. 4.4 小结
  26. 第5章 机器学习资源的收集
  27. 5.1 机器学习资源的获取
  28. 5.2 利用公开的数据集或模型
  29. 5.3 开发者自己创建训练数据
  30. 5.4 他人帮忙输入数据
  31. 5.5 数据创建众包
  32. 5.6 基于服务的用户输入
  33. 5.7 小结
  34. 第6章 效果验证
  35. 6.1 效果验证概述
  36. 6.2 假设检验的框架
  37. 6.3 假设检验的注意事项
  38. 6.4 因果效应的推断
  39. 6.5 A/B测试
  40. 6.6 小结
  41. 第二部分
  42. 第7章 电影推荐系统
  43. 7.1 概述
  44. 7.2 推荐系统功能
  45. 7.3 MovieLens的数据趋势
  46. 7.4 推荐系统的开发
  47. 7.5 小结
  48. 第8章 Kickstarter的数据分析
  49. 8.1 Kickstarter的API
  50. 8.2 Kickstarter的网络爬虫
  51. 8.3 数据变换
  52. 8.4 浏览Excel数据
  53. 8.5 数据透视表
  54. 8.6 达成目标却被取消的项目
  55. 8.7 国别的项目分析
  56. 8.8 形成分析报告
  57. 8.9 进一步的工作
  58. 8.10 小结
  59. 第9章 基于Uplift Modeling的营销资源效率分析
  60. 9.1 Uplift Modeling的四象限分区
  61. 9.2 扩展A/B测试的Uplift Modeling的概要
  62. 9.3 Uplift Modeling的数据集生成
  63. 9.4 利用两个预测模型的Uplift Modeling
  64. 9.5 Uplift Modeling的评价方法
  65. 9.6 实际应用
  66. 9.7 实际应用Uplift Modeling的相关事项
  67. 9.8 小结
  68. 参考文献
  69. 后记
  70. 致谢
书名:机器学习应用系统设计
译者:刘继红 译
国内出版社:中国电力出版社
出版时间:2018年12月
页数:242
书号:978-7-5198-2620-8
原版书书名:Machine Learning at work
原版书出版商:O'Reilly Japan
有贺康顕
 
曾任职电机制造公司研究所、餐饮服务公司,现在Cloudera任职。作为现场数据科学家,从事数据利用、机器学习咨询服务工作。
● https://twitter.com/chezou
● https://www.slideshare.net/chezou
● https://chezo.uno/
 
 
中山心太
 
曾任职电信公司研究所、社交游戏公司、机器学习网络营销公司、自由职业者。目前创建株式会社Next Int。除了本公司的服务开发外,也承接游戏开发企划、机器学习应用等业务。
机器学习、游戏设计、商业设计、新业务企划等,广泛业务均可胜任。
● https://twitter.com/tokoroten
● https://www.slideshare.net/TokorotenNakayama
● https://medium.com/@tokoroten/
 
 
西林孝
 
软件工程师。曾担任系统集成咨询个体工作者、任职软件开发公司,目前任职于株式会社VOYAGE GROUP。从事互联网广告服务的广告发送系统的开发。
● https://hagino3000.blogspot.jp/
● https://speakerdeck.com/hagino3000
● https://twitter.com/hagino3000
 
 
作者介绍
有贺康顕 曾任职电机制造公司研究所、餐饮服务公司,现在Cloudera任职。作为现场数据科学家,从事数据利用、机器学习咨询服务工作。
https://twitter.com/chezou
https://www.slideshare.net/chezou
https://chezo.uno/
中山心太 曾任职电信公司研究所、社交游戏公司、机器学习网络营销公司、自由职业者。目前创建株式会社Next Int。除了本公司的服务开发外,也承接游戏开发企划、机器学习应用等业务。
机器学习、游戏设计、商业设计、新业务企划等,广泛业务均可胜任。
https://twitter.com/tokoroten
https://www.slideshare.net/TokorotenNakayama
https://medium.com/@tokoroten/
西林孝 软件工程师。曾担任系统集成咨询个体工作者、任职软件开发公司,目前任职于株式会社VOYAGE GROUP。从事互联网广告服务的广告发送系统的开发。
https://hagino3000.blogspot.jp/
https://speakerdeck.com/hagino3000
https://twitter.com/hagino3000
封面介绍
本书封面上的动物是大犰狳(Giant armadillo),是贫齿目犰狳科大犰狳属的唯一一种哺乳类动物。
生活在南美的从热带稀树草原到热带雨林的广泛区域,过着地栖生活,属夜行性动物。感到危险时会藏身于洞穴中,难以被发现。最大身长150cm,体重可达50kg。体两侧和四肢外侧覆盖着骨板与鳞板,鳞板其实是演变成鳞片状的体毛。说到犰狳,便会联想到身体蜷缩成球状,以防御天敌侵害。但是,大犰狳并非如此。
栖息在森林里或周边的草原上,喜欢靠近水边。主要食物是白蚁,蚂蚁和其他昆虫,以及蜘蛛、蜥蜴、蛇、动物腐肉、植物等也是它的食物。用前肢挖掘蚁穴或地面,食用地下食物。因被当做可食用动物而被捕猎,数量激减,濒临灭绝。在国际自然保护联盟(IUCN)的红色名录上,被列为濒临灭绝II类(易危)动物。