R语言整洁建模
Max Kuhn, Julia Silge
厉越, 陈立铭, 倪昱橙 译
出版时间:2024年07月
页数:399
“tidymodels框架结合了以人为中心的设计和统计最佳实践,我想不出比Max和Julia给出的更好的学习方法。”
——Hadley Wickham
RStudio首席科学家
“这本书提供了一种统一和系统的方法来构建、分析和评估R中的统计模型。”
——Balasubramanian Narasimhan
斯坦福大学高级研究科学家

tidymodels是一组用于建模和机器学习的R语言包。无论你是新手还是拥有多年建模经验,这本实践用书将为数据分析师、业务分析师和数据科学家展示tidymodels框架如何为你的工作提供一致、灵活的方法。
RStudio的工程师Max Kuhn和Julia Silge展示了通过专注于一种被称为tidyverse的R方言来创建模型的方法。采用tidyverse原则的软件共享高层设计理念和低层语法及数据结构,因此学习生态系统的一部分有助于掌握下一部分。你会明白为什么tidymodels框架被人们广泛使用。

本书内容包括:
● 学习从头到尾构建模型所需的步骤
● 理解如何流畅地使用不同的建模和特征工程方法
● 研究如何避免建模的常见缺陷,比如过拟合
● 学习为建模准备数据的实用方法
● 调整模型以获得最佳性能
● 使用良好的统计实践来比较、评估和选择模型
  1. 前言
  2. 第一部分 简介
  3. 第1章 建模软件
  4. 1.1 建模软件基础
  5. 1.2 模型的类型
  6. 1.3 不同模型间的关系
  7. 1.4 术语说明
  8. 1.5 建模和数据分析的关系
  9. 1.6 本章小节
  10. 第2章 tidyverse入门
  11. 2.1 tidyverse设计原则
  12. 2.2 tidyverse语法示例
  13. 2.3 本章小结
  14. 第3章 R建模基础
  15. 3.1 一个例子
  16. 3.2 R中的公式有什么作用?
  17. 3.3 为什么整洁对建模很重要
  18. 3.4 结合base R和tidyverse
  19. 3.5 tidymodels包
  20. 3.6 本章小结
  21. 第二部分 建模基础
  22. 第4章 埃姆斯市房价数据
  23. 4.1 探索数据特征
  24. 4.2 本章小结
  25. 第5章 数据分配
  26. 5.1 基本的数据划分方法
  27. 5.2 验证集是什么?
  28. 5.3 多水平数据
  29. 5.4 数据分配的其他注意
  30. 5.5 本章小结
  31. 第6章 用parsnip创建模型
  32. 6.1 创建模型
  33. 6.2 使用模型结果
  34. 6.3 进行预测
  35. 6.4 parsnip扩展包
  36. 6.5 创建模型设定的工具
  37. 6.6 本章小结
  38. 第7章 模型工作流
  39. 7.1 模型的起点和终点在哪里?
  40. 7.2 工作流入门
  41. 7.3 向workflow()中添加原始变量
  42. 7.4 workflow()如何使用公式?
  43. 7.5 同时创建多个工作流
  44. 7.6 使用测试集评估模型
  45. 7.7 本章小结
  46. 第8章 用recipes实现特征工程
  47. 8.1 一个简单的配方
  48. 8.2 使用配方
  49. 8.3 recipe()如何处理数据
  50. 8.4 step_*函数示例
  51. 8.5 对新数据跳过操作
  52. 8.6 获取整洁的配方
  53. 8.7 列的角色
  54. 8.8 本章小结
  55. 第9章 衡量模型性能
  56. 9.1 性能指标和推断模型
  57. 9.2 回归模型
  58. 9.3 二分类数据
  59. 9.4 多分类数据
  60. 9.5 本章小结
  61. 第三部分 创建高质量模型
  62. 第10章 用重抽样评估模型
  63. 10.1 重代入法
  64. 10.2 重抽样法
  65. 10.3 评估性能
  66. 10.4 并行处理
  67. 10.5 保存重抽样对象
  68. 10.6 本章小结
  69. 第11章 比较重抽样结果
  70. 11.1 用工作流集合创建多个模型
  71. 11.2 比较重抽样得到的性能指标
  72. 11.3 简单的假设检验方法
  73. 11.4 贝叶斯方法
  74. 11.5 本章小结
  75. 第12章 模型调优和过拟合
  76. 12.1 模型参数
  77. 12.2 不同类型的超参数
  78. 12.3 我们在优化什么?
  79. 12.4 超参数选择不当的后果
  80. 12.5 超参数调优的两种策略
  81. 12.6 tidymodels中的调参
  82. 12.7 本章小结
  83. 第13章 网格搜索
  84. 13.1 规则网格和不规则网格
  85. 13.2 评估网格
  86. 13.3 确定最终模型
  87. 13.4 创建调优设定的工具
  88. 13.5 实现高效网格搜索
  89. 13.6 本章小结
  90. 第14章 迭代搜索
  91. 14.1 支持向量机模型
  92. 14.2 贝叶斯优化
  93. 14.3 模拟退火
  94. 14.4 本章小结
  95. 第15章 筛选多个模型
  96. 15.1 对混凝土强度建模
  97. 15.2 创建工作流集合
  98. 15.3 调优并评估模型
  99. 15.4 高效筛选模型
  100. 15.5 确定最终模型
  101. 15.6 本章小结
  102. 第四部分 其他高级方法
  103. 第16章 降维
  104. 16.1 降维可以解决哪些问题?
  105. 16.2 一图胜千……豆
  106. 16.3 基础配方
  107. 16.4 使用配方
  108. 16.5 特征提取技术
  109. 16.6 建模
  110. 16.7 本章小结
  111. 第17章 编码分类数据
  112. 17.1 数据需要编码吗?
  113. 17.2 编码有序分类变量
  114. 17.3 使用结果变量的编码方法
  115. 17.4 特征哈希
  116. 17.5 更多编码方法
  117. 17.6 本章小结
  118. 第18章 模型解释
  119. 18.1 可用于模型解释的R包
  120. 18.2 局部解释
  121. 18.3 全局解释
  122. 18.4 从局部解释构建全局解释
  123. 18.5 回到干豆数据集!
  124. 18.6 本章小结
  125. 第19章 何时相信预测结果?
  126. 19.1 模棱两可的结果
  127. 19.2 确定模型适用性
  128. 19.3 本章小结
  129. 第20章 模型集成
  130. 20.1 为堆叠模型准备训练集
  131. 20.2 融合基模型的预测结果
  132. 20.3 拟合候选模型
  133. 20.4 测试集结果
  134. 20.5 本章小结
  135. 第21章 推断分析
  136. 21.1 计数数据的统计推断
  137. 21.2 与两样本检验的比较
  138. 21.3 对数线性模型
  139. 21.4 更复杂的模型
  140. 21.5 更多推断分析
  141. 21.6 本章小结
  142. 附录 推荐的预处理步骤
  143. 参考文献
书名:R语言整洁建模
作者:Max Kuhn, Julia Silge
译者:厉越, 陈立铭, 倪昱橙 译
国内出版社:东南大学出版社
出版时间:2024年07月
页数:399
书号:978-7-5766-0944-8
原版书书名:Tidy Modeling with R
原版书出版商:O'Reilly Media
Max Kuhn
 
Max Kuhn是RStudio的一名软件工程师,致力于提高R语言的建模能力。他在制药和诊断行业应用各种模型超过18年。
 
 
Julia Silge
 
Julia Silge是RStudio的一名软件工程师,致力于开发开源建模工具。她拥有天体物理学博士学位,曾在科技和非营利部门担任数据科学家。
 
 
本书封面上的动物是欧洲知更鸟(拉丁学名:Erithacus rubecula),是一种主要生活在欧洲大陆、英国、俄罗斯西部和非洲北部地区的鸟类。
欧洲知更鸟通常呈灰褐色,胸部呈橙色,腹部为白色。雌鸟和雄鸟看起来很相似,主要的区别在于喙的形状。它们喜欢生活在森林、植被或树木附近。欧洲知更鸟在冬季通常不会迁徙很远的距离(除了生活在斯堪的纳维亚和俄罗斯北部的种群),但雌鸟在冬季会离开雄鸟一段距离,而雄鸟在冬季和夏季都保持相同的领地。
欧洲知更鸟通常从3月份开始繁殖,每次会筑多个巢,每个巢中有4枚到6枚蛋,孵化时间为13天到14天。这些巢在孵化时可能会有一定程度的重叠,雄鸟会在雌鸟孵蛋期间喂养新生幼鸟,而雌鸟则开始孵下一个巢的蛋。雄鸟通过给雌鸟喂食来与其建立紧密的联系,这对于不熟悉情况的观察者来说可能会看起来像是母鸟在喂养幼鸟。它们的食物包括昆虫、种子、坚果和水果。
欧洲知更鸟在出生后的第一年内的死亡率非常高。在这之后它们的预期寿命会显著增加。在第一年之后的死亡中,有10%是由于知更鸟之间的争斗导致的,因为雄性知更鸟非常具有攻击性且领地意识非常强。年轻的知更鸟胸部的橙色不够明显,这也减少了它们在第一年争夺领地的机会,但这时它们的死亡率已经很高了。
自1960年以来,欧洲知更鸟一直是英国的国鸟,但在欧洲其他地区并不那么受欢迎。它们是圣诞节的流行象征,因为维多利亚时期的邮递员由于制服颜色而被称为“红胸鸟”。美国知更鸟是因为外观与欧洲知更鸟相似而得名,但它们实际上并没有密切的亲缘关系。
欧洲知更鸟的保护状态为“低危”(Least Concern,LC)。
购买选项
定价:129.00元
书号:978-7-5766-0944-8
出版社:东南大学出版社