数据科学的数学基础
Thomas Nield
孙蒙, 王艺敏, 闻传花, 邹霞 译
出版时间:2023年09月
页数:353
“在当前喧嚣的数据科学教育环境下,这本书的与众不同在于,它用许多清晰、实用的例子说明了理解和构建数据所需的基础知识。”
——Vicki Boykis
Tumblr高级机器学习工程师

要在数据科学、机器学习和统计学方面表现优异,就需要掌握相关的数学知识。本书中,作者Thomas Nield将指导你涉足微积分、概率论、线性代数和统计学等领域,以及如何将它们应用于线性回归、逻辑斯蒂回归和神经网络等技术。在此过程中,你还将获得对数据科学现状的实际见解,并学习如何充分利用这些见解来规划你的职业生涯。

学习如何:
● 使用Python代码和SymPy、NumPy、scikit-learn等库,探索微积分、线性代数、统计学和机器学习等基本数学概念
● 用朴素的语言和最少的数学符号及术语去理解线性回归、逻辑斯蒂回归和神经网络等技术
● 对数据集进行描述性统计和假设检验,以解释p值和统计显著性
● 操作向量和矩阵并对矩阵进行分解
● 整合并构建微积分、概率论、统计学和线性代数的增量知识,并将其应用于包括神经网络在内的回归模型
● 通过数据科学职业生涯中的实际经历,让你避免常见的陷阱、假设和偏见,同时调整技能组合,以便你能在就业市场中脱颖而出
  1. 前言
  2. 第1章 基本的数学和微积分回顾
  3. 数论
  4. 运算顺序
  5. 变量
  6. 函数
  7. 求和
  8. 指数
  9. 对数
  10. 欧拉数与自然对数
  11. 欧拉数
  12. 自然对数
  13. 极限
  14. 导数
  15. 偏导数
  16. 链式法则
  17. 积分
  18. 结论
  19. 习题
  20. 第2章 概率论
  21. 理解概率
  22. 概率与统计
  23. 概率数学
  24. 联合概率
  25. 并集概率
  26. 条件概率与贝叶斯定理
  27. 联合条件概率和并集条件概率
  28. 二项分布
  29. 贝塔分布
  30. 结论
  31. 习题
  32. 第3章 描述统计学和推理统计学
  33. 什么是数据?
  34. 描述统计学与推理统计学
  35. 总体、样本和偏差
  36. 描述统计学
  37. 均值与加权均值
  38. 中位数
  39. 众数
  40. 方差和标准差
  41. 正态分布
  42. 逆CDF
  43. Z分数
  44. 推理统计学
  45. 中心极限定理
  46. 置信区间
  47. 理解p值
  48. 假设检验
  49. t分布:处理小样本
  50. 大数据考虑和德州神枪手谬论
  51. 结论
  52. 习题
  53. 第4章 线性代数
  54. 什么是向量?
  55. 向量的加法和组合
  56. 缩放向量
  57. 张成空间和线性相关
  58. 线性变换
  59. 基向量
  60. 矩阵向量乘法
  61. 矩阵乘法
  62. 行列式
  63. 特殊类型的矩阵
  64. 方阵
  65. 单位矩阵
  66. 逆矩阵
  67. 对角矩阵
  68. 三角矩阵
  69. 稀疏矩阵
  70. 方程组与逆矩阵
  71. 特征向量和特征值
  72. 结论
  73. 习题
  74. 第5章 线性回归
  75. 基本线性回归
  76. 残差和平方误差
  77. 寻找最佳拟合直线
  78. 封闭式方程
  79. 逆矩阵方法
  80. 梯度下降法
  81. 过拟合和方差
  82. 随机梯度下降
  83. 相关系数
  84. 统计显著性
  85. 判定系数
  86. 估计值的标准误差
  87. 预测区间
  88. 训练/测试切分
  89. 多元线性回归
  90. 结论
  91. 习题
  92. 第6章 逻辑斯蒂回归与分类
  93. 理解逻辑斯蒂回归
  94. 实施逻辑斯蒂回归
  95. 逻辑斯蒂函数
  96. 拟合逻辑斯蒂曲线
  97. 多变量逻辑斯蒂回归
  98. 理解对数几率
  99. R2
  100. p值
  101. 训练/测试切分
  102. 混淆矩阵
  103. 贝叶斯定理与分类
  104. 受试者工作特征/曲线下面积
  105. 类别不均衡
  106. 结论
  107. 习题
  108. 第7章 神经网络
  109. 何时使用神经网络和深度学习
  110. 一种简单的神经网络
  111. 激活函数
  112. 前向传播
  113. 反向传播
  114. 计算权重和偏置的导数
  115. 随机梯度下降
  116. 使用scikit-learn
  117. 神经网络和深度学习的局限性
  118. 结论
  119. 习题
  120. 第8章 职业建议和前进道路
  121. 重新定义数据科学
  122. 数据科学简史
  123. 找到你的优势
  124. SQL能力
  125. 编程能力
  126. 数据可视化
  127. 了解你的行业
  128. 富有成效的学习
  129. 从业者与顾问
  130. 数据科学工作需要注意什么
  131. 角色定义
  132. 组织焦点和认同
  133. 充足的资源
  134. 合理的目标
  135. 与现有系统竞争
  136. 角色不是你想要的
  137. 你理想的工作不存在吗?
  138. 我现在该去哪里?
  139. 结论
  140. 附录A 补充专题
  141. 附录B 习题答案
书名:数据科学的数学基础
作者:Thomas Nield
译者:孙蒙, 王艺敏, 闻传花, 邹霞 译
国内出版社:东南大学出版社
出版时间:2023年09月
页数:353
书号:978-7-5766-0495-5
原版书书名:Essential Math for Data Science
原版书出版商:O'Reilly Media
Thomas Nield
 
Thomas Nield是Nield咨询集团的创始人,也是O’Reilly Media和南加州大学的讲师。他喜欢让技术内容与那些不熟悉它或被它吓倒的人关联起来。Thomas定期教授数据分析、机器学习、数学优化、人工智能系统安全和实用人工智能等课程。他写了Getting Started with SQL (O’Reilly) 和 Learning RxJava (Packt) 两本书。他也是Yawman Flight公司的创始人和发明者,该公司为飞行模拟和无人机开发通用手持控制。
 
 
《数据科学的数学基础》封面上的动物是四纹草鼠(Rhabdomys pumilio)。这种啮齿类动物分布在非洲大陆的南半部,栖息在热带草原、沙漠、农田、灌木丛甚至城市。就像它的名字一样,这种动物的背上有四道独特的深色条纹。即使是刚出生的幼鼠,在它无毛的皮肤上也可见到这些色素线的条纹。
草鼠皮毛的颜色从深棕色到灰白色不等,侧面和腹部颜色较浅。一般来说,该物种长大后约有18~21cm长(不算尾巴,尾巴和身体的长度大致相等),重30~55g。草鼠在白天最活跃,以种子、植物和昆虫为食。在夏季的几个月里,它倾向于吃更多的植物和种子等,以保持脂肪储备,从而度过食物供应有限的冬季。
由于四纹草鼠的活动范围很广,因此人们很容易观察到它们,人们早已注意到它们会在独居和社交生活方式之间转换。在繁殖季节,它们倾向于保持独立(也许是为了避免过度的繁殖竞争),雌性对它们的洞穴有领地意识。当然,除此之外,草鼠会成群结队地觅食,躲避捕食者,挤在一起取暖。
O’Reilly封面上的许多动物濒临灭绝,它们对世界都很重要。
封面插图由Karen Montgomery创作,取材于自然历史博物馆的一幅古董版画。
购买选项
定价:118.00元
书号:978-7-5766-0495-5
出版社:东南大学出版社