基于R语言的机器学习
马晶慧 译
出版时间:2018年11月
页数:218
如果你有基本的编程概念,那么这本入门指导书可以帮助你建立扎实的机器学习的基础。本书使用R语言,首先介绍回归建模,继而介绍神经网络和基于树的方法等更加高级的内容。
最后,我们将深入机器学习的前沿,了解R语言的caret包。一旦熟悉回归与分类模型之间的区别等内容以后,你就可以解决一系列机器学习的问题了。本书作者提供了很多例子帮助你理解机器学习的知识。
● 介绍机器学习领域的模型、算法和数据训练。
● 了解监督和非监督机器学习算法。
● 针对模型使用的数据进行统计验证。
● 深入了解商业和科学中使用的线性回归模型。
● 使用单层和多层神经网络计算结果。
● 介绍基于树的模型的工作原理,以及流行的决策树。
● 了解R语言中机器学习的生态环境。
● 介绍R语言提供的强大的工具caret包。
- 前言
- 第1章 什么是模型?
- 算法与模型有什么不同?
- 术语说明
- 模型的局限性
- 建模中的统计与计算
- 数据训练
- 交叉验证
- 为什么使用R语言?
- 优点
- 缺点
- 小结
- 第2章 监督学习与无监督机器学习
- 监督模型
- 回归
- 训练数据与测试数据
- 分类
- 混合方法
- 无监督学习
- 无监督聚类方法
- 小结
- 第3章 R语言中的采样统计和模型训练
- 偏差
- R语言中的采样
- 训练与测试
- 交叉验证
- 小结
- 第4章 全面解析回归
- 线性回归
- 多项式回归
- 拟合数据的优点——过度拟合的风险
- 逻辑回归
- 小结
- 第5章 全面解析神经网络
- 单层神经网络
- 用R语言建立一个简单的神经网络
- 多层神经网络
- 回归神经网络
- 神经网络分类
- 使用caret的神经网络
- 小结
- 第6章 基于树的方法
- 简单的树模型
- 决定树的分割方式
- 决策树的优点和缺点
- 条件推理树
- 随机森林
- 小结
- 第7章 其他高级方法
- 朴素贝叶斯分类
- 主成分分析
- 支持向量机
- k最近邻算法
- 小结
- 第8章 使用caret包实现机器学习
- 泰坦尼克号数据集
- 使用caret
- 小结
- 附录A caret机器学习模型大全
书名:基于R语言的机器学习
译者:马晶慧 译
国内出版社:中国电力出版社
出版时间:2018年11月
页数:218
书号:978-7-5198-2585-0
原版书书名:Introduction to Machine Learning with R
原版书出版商:O'Reilly Media
Scott V. Burger
Scott V. Burger是一名高级数据科学家,他在美国西雅图生活和工作。他拥有天体物理学领域的编程经验,并将这些经验用于各种不同的方面,例如商业智能或数据优化等。Scott拥有丰厚的经验关于如何用简洁的方式向公众解释科学概念,他利用这些专业知识在本书中向普通R语言用户揭示了机器学习的世界。
毛和(成年)炯炯有神的白色眼睛。有时它被称作乌鸦,虽然这种乌鸦与澳大利亚的乌鸦有区别,因为它的喉咙处有蓬松的颈羽。虽然乌鸦和渡鸦之间没有清楚的区别,但一般来说,乌鸦的身形较小。我们可以在大陆的南部和东部区域见到这种澳洲渡鸦,它的自然栖息地是林地,但它很容易适应城市地区的生活。
澳洲渡鸦是杂食性的动物(虽然它往往会吃很多肉),食物包括水果、昆虫、卵、腐肉、小动物和谷物。它还喜欢投机取巧,并以喜欢偷食人类的垃圾而著称。这种鸟长约18到21英寸。成对的渡鸦交配生活,并会用树枝、草和其他柔软的材料共同构建一个不太整齐的碗形巢。这种渡鸦会划分自己的领土,当遇到入侵者时,它们会发出响亮的警告或驱逐敌人。
在一些原住民的传统意识中,乌鸦是骗子的形象,而在努噶(Noongar)人的传说中这些鸟可以将死者的灵魂带到来世,其他澳大利亚人给它们起的绰号是“灌木丛中的执事”。
O’Reilly出版的图书,封面上很多动物都濒临灭绝。这些动物都是地球的至宝。如果你想知道如何保护这些动物,请访问animals.oreilly.com。
封面图片来自Wood’s Illustrated Natural History。