深度学习实战
Anirudh Koul, Siddha Ganju, Meher Kasam
李新叶 译
出版时间:2021年04月
页数:592
“书名中用‘实战’一词非常合适。对于当今业界的机器学习实践,存在两个突出的问题:员工需要提升和模型需要微调。这本书同时满足上述需求。”
——Paco Nathan
Derwen Al创始人
无论你是一个渴望进入人工智能领域的软件工程师,还是一位资深的数据科学家,又或是一个梦想着制造下一个流行的AI软件的爱好者,你可能都想知道如何开始深度学习。本书将教你如何使用实际操作逐步构建云端、移动端、浏览器和边缘设备上的深度学习实际应用程序。
凭借多年将深度学习研究转化为获奖应用的行业经验,本书作者指导你将想法转化为人们可以实际应用的东西。
● 用Keras、TensorFlow、Core ML,以及TensorFlow Lite训练、微调并发布计算机视觉模型。
● 为不同设备开发AI应用,包括Raspberry Pi、Jetson Nano,以及Google Coral。
● 探索有趣的项目,从硅谷“热狗识别”应用程序到谷歌规模的图像搜索,以及40多个案例研究和行业实例。
● 在电子游戏环境中模拟一辆自动驾驶汽车并用强化学习构建一个微型版自动驾驶汽车。
● 使用迁移学习在几分钟内训练模型。
● 发现50多个实用技巧,用以最大化模型准确度和速度、调试程序,以及将应用扩展到数百万用户规模。
  1. 前言
  2. 第1章 探索人工智能前景
  3. 致歉
  4. 真正的介绍
  5. 什么是人工智能?
  6. 人工智能简史
  7. 完美深度学习解决方案的组成要素
  8. 负责任的人工智能
  9. 总结
  10. 常见问题
  11. 第2章 图片中有什么:用Keras实现图像分类
  12. Keras简介
  13. 预测图像类别
  14. 调查模型
  15. 总结
  16. 第3章 猫与狗:用Keras在30行代码中实现迁移学习
  17. 使预先训练的模型适应新任务
  18. 利用迁移学习和Keras构建一个定制的分类器
  19. 组织数据
  20. 建立数据管道
  21. 数据扩充
  22. 定义模型
  23. 训练模型
  24. 测试模型
  25. 分析结果
  26. 进一步阅读
  27. 总结
  28. 第4章 构建反向图像搜索引擎:理解嵌入
  29. 图像相似性
  30. 特征提取
  31. 相似性搜索
  32. 用t-SNE可视化图像簇
  33. 提高相似性搜索的速度
  34. 基于近似最近邻方法扩展相似搜索
  35. 通过微调提高精度
  36. 用于一次人脸验证的孪生网络
  37. 案例研究
  38. 总结
  39. 第5章 从初学者到掌握预测:最大化卷积神经网络的精度
  40. 工具介绍
  41. 机器学习实验常用技术
  42. 端到端深度学习例子管道
  43. 超参数如何影响精度
  44. 通过自动调整获得最大精度的工具
  45. 总结
  46. 第6章 最大化TensorFlow的速度和性能:一个简便的检查表
  47. GPU闲置
  48. 如何使用本章的检查表
  49. 性能检查表
  50. 数据准备
  51. 数据读取
  52. 数据扩充
  53. 训练
  54. 预测
  55. 总结
  56. 第7章 实用工具、提示和技巧
  57. 安装
  58. 训练
  59. 模型
  60. 数据
  61. 隐私
  62. 教育与探索
  63. 最后一个问题
  64. 第8章 计算机视觉的云API:15分钟内启动并运行
  65. 视觉识别API的前景
  66. 比较不同的视觉识别API
  67. 启动和运行云API
  68. 训练我们自定义的分类器
  69. 比较自定义分类API
  70. 云API的性能调整
  71. 案例研究
  72. 总结
  73. 第9章 使用TensorFlow服务和KubeFlow在云上提供可扩展预测服务
  74. 服务人工智能预测的前景
  75. Flask:建立自己的服务器
  76. 生产级服务系统的理想品质
  77. Google Cloud ML引擎:一个托管云AI的服务栈
  78. TensorFlow服务
  79. KubeFlow
  80. 价格相对于性能考虑
  81. 总结
  82. 第10章 基于TensorFlow.js和ml5.js在浏览器中实现AI
  83. 基于JavaScript的机器学习库:简史回顾
  84. TensorFlow.js架构
  85. 使用TensorFlow.js运行预训练模型
  86. 模型转换为浏览器中格式
  87. 浏览器中训练
  88. ml5.js
  89. PoseNet
  90. pix2pix
  91. 基准和实际考虑
  92. 案例研究
  93. 总结
  94. 第11章 基于Core ML在iOS上实现实时对象分类
  95. 移动端人工智能的开发生命周期
  96. Core ML的简史
  97. Core ML的替代品
  98. 苹果的机器学习架构
  99. 构建实时目标识别应用程序
  100. 转换为Core ML
  101. 动态模型部署
  102. 设备端训练
  103. 性能分析
  104. 测量能耗的影响
  105. 缩小应用程序大小
  106. 案例研究
  107. 总结
  108. 第12章 基于Core ML和Create ML在iOS上实现热狗识别
  109. 收集数据
  110. 训练我们的模型
  111. 使用Core ML工具进行模型转换
  112. 构建iOS应用程序
  113. 进一步探索
  114. 总结
  115. 第13章 Shazam for Food:使用TensorFlow Lite和ML工具包开发Android应用程序
  116. 食品分类应用程序的生命周期
  117. TensorFlow Lite概述
  118. 模型转换为TensorFlow Lite
  119. 构建实时对象识别应用程序
  120. ML Kit + Firebase
  121. iOS上的TensorFlow Lite
  122. 性能优化
  123. Fritz
  124. 全面审视移动人工智能应用程序开发周期
  125. 自演化模型
  126. 案例研究
  127. 总结
  128. 第14章 使用TensorFlow目标检测API构建完美的猫定位应用程序
  129. 计算机视觉任务的类型
  130. 目标检测方法
  131. 调用预先构建的基于云的目标检测API
  132. 重用预训练模型
  133. 不需任何代码构建自定义检测器
  134. 目标检测的发展
  135. 目标检测中的关键术语
  136. 使用TensorFlow目标检测API构建自定义模型
  137. 检查模型
  138. 图像分割
  139. 案例研究
  140. 总结
  141. 第15章 成为创客:探索边缘的嵌入式人工智能
  142. 探索嵌入式人工智能设备的前景
  143. 嵌入式人工智能设备的定性比较
  144. 从 Raspberry Pi开始
  145. 使用Google Coral USB加速器加速
  146. NVIDIA Jetson Nano端口
  147. 比较边缘设备的性能
  148. 案例研究
  149. 进一步探索
  150. 总结
  151. 第16章 利用Keras端到端深度学习模拟自动驾驶汽车
  152. 自动驾驶简史
  153. 深度学习、自主驾驶和数据问题
  154. 自动驾驶的欢迎例子(“Hello, World!”):在模拟环境中驾驶
  155. 数据探索与准备
  156. 训练我们的自动驾驶模型
  157. 部署我们的自动驾驶模式
  158. 进一步探索
  159. 总结
  160. 第17章 在一小时内制造一辆自动驾驶汽车:AWS DeepRacer的强化学习
  161. 强化学习简介
  162. 为什么要用自动驾驶汽车例子学习强化学习?
  163. 使用DeepRacer进行实际的深度强化学习
  164. 正在使用的强化学习
  165. 让AWS DeepRacer赛车参加比赛
  166. 进一步探索
  167. 总结
  168. 附录 卷积神经网络速成课程
  169. 作者介绍
  170. 封面介绍
书名:深度学习实战
译者:李新叶 译
国内出版社:中国电力出版社
出版时间:2021年04月
页数:592
书号:978-7-5198-5293-1
原版书书名:Practical Deep Learning for Cloud, Mobile, and Edge
原版书出版商:O'Reilly Media
Anirudh Koul
 
Anirudh Koul是一位著名的人工智能专家, UN/TEDx演讲者,也是微软人工智能与研究中心的前资深科学家,他在那里创立了Seeing AI,Seeing AI通常被认为是继iPhone之后盲人社区中使用最多的技术。Anirudh是人工智能与研究中心Aira平台的负责人,被《时代》杂志评为2018年最佳发明人之一。凭借向十亿用户提供的功能,他带来了十多年面向生产实际的PB级数据集的应用研究经验。他一直在使用人工智能开发以下应用技术:增强现实、机器人、语音、生产力以及可访问性。他在Al for Good的工作被IEEE称为“改变生活”(“life-changing”),曾在联合国、世界经济论坛、白宫、上议院、Netflix和国家地理杂志的活动中展示,他为此获得了CES、FCC、MIT、戛纳国际创意节和美国盲人理事会的奖项;并受到包括Justin Trudeau和Theresa May在内的世界领导人的称赞。
 
 
Siddha Ganju
 
Siddha Ganju是NVIDIA的自动驾驶设计师,她作为一名AI研究者曾入选福布斯“30岁以下30位”排行榜榜单。作为NASA FDL的人工智能顾问,她为NASA的CAMS项目建立了一个自动流星探测管道,该项目发现了一颗彗星。此前,她在Deep Vision为资源受限的边缘设备开发了深度学习模型。她的工作范围从视觉问答到生成性对抗网络,再到从CERN的PB级数据中收集观点,这些工作已发表在顶级会议上,包括CVPR和NeurIPS会议。她曾在包括CES在内的多个国际科技比赛中担任特邀评委。她提倡技术的多样性和包容性,在学校和学院演讲,以激励和培养来自各种背景的新一代技术专家。
 
 
Meher Kasam
 
Meher Kasam是一位经验丰富的软件开发人员,所开发的应用程序每天都有数以千万计的用户使用。他目前是Square的iOS开发者,此前曾在微软和亚马逊工作,他为一系列应用程序开发了功能,包括从Square的销售点(POS)APP到微软必应(Bing)iPhone应用程序。在微软工作期间,他是Seeing AI应用程序的移动开发负责人,该应用程序获得了诸如移动世界大会、CES、FCC和美国盲人协会等的广泛认可和奖励。作为一个具有快速原型设计天赋的黑客,他赢得了几次黑客大会的比赛,并将其程序转换为广泛使用的产品中的功能。他还担任全球移动奖和爱迪生奖国际比赛的评委。
 
 
本书的封面动物是一只美国游隼(学名:Falco peregrinus anatum)或鸭鹰,它是游隼的一个亚种,目前发现于洛基山脉。这种亚种在北美洲东部已经灭绝,但现在随着有组织的重新引入,存在健康的杂交种群。
全世界的游隼,不管是哪一个亚种,都有以下几个共同的特点:快速飞行的大型猛禽;其头和翅膀都是黑色的;下侧都是白色有图案的;喙和腿都是黄色的;大大的眼睛黑色眼球上有独特的竖直条纹。在远处可以通过游隼“弯曲”但轮廓分明的翅膀辨别。雌性明显比雄性大,但两者的平均体型都和美国乌鸦差不多,在保卫领地或雏鸟时,它们会发出一种独特、尖锐的“咔嚓咔嚓”的叫声。
游隼(以它们在非筑巢季节有着远行的习性命名)在除南极洲以外的所有大陆上都有了自己的足迹。其物种的成功延续取决于它们对猎鸟的多种适应能力,以及适应不同筑巢环境和猎物的能力。游隼最著名的习性是弯腰狩猎或称为高速俯冲,它从一个很大的高度俯冲到地面或接近地面的一只鸟身上,当它撞到猎物时速度可达每小时200英里,很多时候会瞬间杀死猎物。这使得它不仅是地球上飞得最快的鸟,而且是动物王国中跑得最快的成员,这也是为什么游隼成为全世界猎鹰者最喜欢的鸟的原因。
游隼在20世纪60年代成为美国环保运动的一个明显标志,因为在化学物质被禁止使用之前,杀虫剂DDT的广泛使用已经使游隼在其以前生活的大部分地区灭绝(游隼通过猎物消耗DDT,导致其卵壳变薄的致命效果)。美国环境保护署在1970年宣布这种游隼为濒危物种。然而,由于DDT的禁止使用,该物种已经恢复。随后又实施了一项圈养繁殖计划,将该物种重新引入美国东部游隼以前的生活区域。随着巢盒被添加到城市摩天大楼的上空,游隼用鸽子和其他大量的城市鸟类喂养其雏鸟,导致种群迅速建立起来。游隼在1999年被从濒危物种名单上除名。虽然美国游隼目前的保护状况被指定为是无危物种,但O'Reilly书籍封面的许多动物都是濒危动物,它们都是世界上重要的动物。
封面插图来自Karen Montgomery,基于《British Birds》中的一个黑白雕刻。