强化学习
邹伟, 康俊鹏, 王伟 译
出版时间:2023年02月
页数:427
“强化学习出色地展示了它的技术背景、发展前景和未来机会,它将显著的推进数据科学家在其业务上的工作方式。”
——David Aronchick
Kubeflow联合创始人
“对于任何想要应用强化学习技术来解决现实问题的人来说,这本书都是必读的。它将以实践中的案例和细致的解释,带领读者漫游强化学习的第一个定理到顶会的前沿技术。”
——David Foster
应用数据科学合伙人
“伟大著作!本书详细解释了被实践验证的那些强化学习方法,它们被封装形成了软件开发人员的标准库。”
——Danny Lange
Unity人工智能高级副总裁
强化学习将是未来十年在人工智能领域的最大突破之一,强化学习算法能够使得智能体在环境中学习任意目标。这一令人兴奋的发展打破了传统机器学习的算法约束。这本实用的书向数据科学和人工智能专业人员展示了如何通过强化的手段使机器能够自己
学习。
本书作者创办了自己名字命名的研究型公司,本书涵盖了从基本的构建模块到最先进的实践。通过本书,你将探索强化学习的当前状态、关注工业应用、学习大量算法,本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书,书中包含很多数学知识,并期望读者是熟悉机器学习的。
● 学习强化学习是什么,以及算法如何解决具体问题。
● 掌握强化学习的基础知识,包括马尔可夫决策过程、动态规划和时间差分算法。
● 深入研究一系列基于值函数和政策梯度的算法。
● 应用先进的强化学习解决方案,如元学习、分层学习、多智能体、模仿学习等。
● 了解最前沿的深度强化学习算法,包括Rainbow、PPO、TD3、SAC等。
● 通过本书专门的配套网站获得实践代码和案例。
书名:强化学习
译者:邹伟, 康俊鹏, 王伟 译
国内出版社:中国电力出版社
出版时间:2023年02月
页数:427
书号:978-7-5198-6961-8
原版书书名:Reinforcement Learning
原版书出版商:O'Reilly Media
Phil Winder
Phil Winder博士是一名多学科交叉的软件工程师、数据科学家,以及温德研究所(https://WinderResearch.com/?utm_source=oreilly&utm_medium=book&utm_campaign=rl)的CEO。该研究所主要提供云计算科学咨询,主营业务是帮助初创企业和其他企业基于数据改进流程、平台和产品。他专门从事生产级云端机器学习的本地实现,也是机器学习运维的早期支持者。
他在各类公开论坛、个体网站以及O’Reilly在线学习平台上开设的数据科学课程,已经让数千名工程师受益。他的课程专注于工业级的数据科学应用,涵盖了从数据清理到深度强化学习等各类热门但实用的主题,经常活跃在数据科学领域并发表相关演讲。
Phil毕业于英国赫尔大学,获取了电子工程专业的硕士和博士学位,现居英国约克郡,家里有他喜爱的一整套酿酒设备和他的家人。
如需任何支持或建议,请通过以下方式与作者联系:
网站:https://WinderResearch.com。
电子邮件:phil@winderresearch.com。
LinkedIn:DrPhilWinder (https://www.linkedin.com/in/DrPhilWinder/)。
Twitter:@DrPhilWinder (https://twitter.com/DrPhilWinder)。
本书封面上的动物是一只非洲黑脚企鹅(学名:Spheniscus demersus)。该企鹅属下的四个物种被统称称为带状企鹅,因为它们的身体周围有黑色带。这些企鹅的背部也是黑色,其黑色的喙上有一条白色的细长垂直带,腹部有斑点,眼睛周围有一块区域没有羽毛的裸露皮肤。
这些企鹅生活在非洲西南海岸,分布在24个岛屿上,只有少数生活在非洲大陆上。
19世纪初,它们非洲大约有400万只。如今,其种群数量已经下降了95%。据估计,非洲黑脚企鹅将在未来10年内灭绝。它们当前面临着许多威胁,包括急剧减少的食物来源等。因为它们主要食物来源是一些当地的海洋鱼类,而这些鱼类对水温上升很敏感。
非洲黑脚企鹅的种群存续岌岌可危。O’Reilly的书籍封面上的许多动物都濒临灭绝,对于我们这个世界来说,它们中的每一个都很重要。
封面插图由Karen Montgomery根据Lydekker’s Royal Natural History中的一幅黑白版画绘制。