时间序列分析实战:基于机器学习和统计学
Aileen Nielsen
王祎, 冯英睿 译
出版时间:2023年01月
页数:515
“这本书是不错的资源。每个数据科学家都会在某个时刻开始处理时间序列或其他类型的函数型数据。这本书介绍了机器学习和时间序列分析,并提供了精心设计的示例。”
——Andreas W. Kempa-Liehr博士
奥克兰大学工程科学系讲师

天气、股票、心跳都会产生时间序列数据,物联网、数字化医疗和智慧城市的兴起更是产生了大量的时间序列数据。随着数据的规模快速增长,应用机器学习和统计方法进行时间序列分析的做法越来越普遍,也越来越重要。
本书从实战角度介绍时间序列分析中的创新技术和实际用例,帮助你结合使用传统的统计方法和先进的机器学习技术来解决时间序列分析中的常见问题。由于Python和R都是时间序列分析常用的语言,因此本书兼顾这两种语言并对时间序列进行全面的阐释,可以让数据分析师、数据工程师和其他与数据打交道的读者快速上手。
● 发现并整理时间序列数据
● 针对时间序列进行探索性数据分析
● 模拟时间序列
● 存储时间序列
● 为时间序列生成并选择特征
● 测量误差
● 使用机器学习和深度学习分析时间序列
● 评估模型的精度和性能
  1. 前言
  2. 第1章 时间序列:概述和简史
  3. 1.1 时间序列在历史上的各种应用
  4. 1.1.1 医学中的时间序列问题
  5. 1.1.2 气象预测
  6. 1.1.3 经济增长预测
  7. 1.1.4 天文学
  8. 1.2 时间序列分析的兴起
  9. 1.3 统计时间序列分析的起源
  10. 1.4 时间序列分析在机器学习领域的起源
  11. 1.5 更多资源
  12. 第2章 时间序列的发现与整理
  13. 2.1 时间序列数据何处寻
  14. 2.1.1 准备好的数据集
  15. 2.1.2 “找到的时间序列”
  16. 2.2 将表集合改造成时间序列数据集合
  17. 2.2.1 示例:组装时间序列数据集合
  18. 2.2.2 构造“找到的时间序列”
  19. 2.3 时间戳问题
  20. 2.3.1 谁的时间戳
  21. 2.3.2 推测时间戳以理解数据
  22. 2.3.3 什么是有意义的时间尺度
  23. 2.4 清理数据
  24. 2.4.1 处理数据缺失
  25. 2.4.2 上采样和下采样
  26. 2.4.3 数据平滑
  27. 2.4.4 季节性数据
  28. 2.4.5 时区
  29. 2.4.6 预防前瞻
  30. 2.5 更多资源
  31. 第3章 针对时间序列的探索性数据分析
  32. 3.1 常用方法
  33. 3.1.1 折线图
  34. 3.1.2 直方图
  35. 3.1.3 散点图
  36. 3.2 探索时间序列数据的方法
  37. 3.2.1 理解平稳性
  38. 3.2.2 应用窗口函数
  39. 3.2.3 理解和识别自相关性
  40. 3.2.4 伪相关性
  41. 3.3 一些有用的可视化方式
  42. 3.3.1 一维可视化
  43. 3.3.2 二维可视化
  44. 3.3.3 三维可视化
  45. 3.4 更多资源
  46. 第4章 模拟时间序列
  47. 4.1 模拟时间序列有何特别之处
  48. 4.2 代码模拟
  49. 4.2.1 自己动手
  50. 4.2.2 构建一个自行运转的模拟世界
  51. 4.2.3 物理模拟
  52. 4.3 写在最后
  53. 4.3.1 统计模拟
  54. 4.3.2 深度学习模拟
  55. 4.4 更多资源
  56. 第5章 存储时间序列
  57. 5.1 定义需求
  58. 5.2 数据库解决方案
  59. 5.2.1 SQL与NoSQL
  60. 5.2.2 流行的时间序列数据库
  61. 5.3 文件解决方案
  62. 5.3.1 NumPy
  63. 5.3.2 Pandas
  64. 5.3.3 R语言中的标准格式
  65. 5.3.4 Xarray
  66. 5.4 更多资源
  67. 第6章 时间序列的统计模型
  68. 6.1 为什么不使用线性回归
  69. 6.2 时间序列的统计方法
  70. 6.2.1 自回归模型
  71. 6.2.2 移动平均模型
  72. 6.2.3 差分自回归移动平均模型
  73. 6.2.4 向量自回归模型
  74. 6.2.5 多样的统计模型
  75. 6.3 时间序列统计模型的优缺点
  76. 6.4 更多资源
  77. 第7章 时间序列的状态空间模型
  78. 7.1 状态空间模型的优缺点
  79. 7.2 卡尔曼滤波器
  80. 7.2.1 概述
  81. 7.2.2 为卡尔曼滤波器编码
  82. 7.3 隐马尔可夫模型
  83. 7.3.1 模型的工作原理
  84. 7.3.2 如何拟合模型
  85. 7.3.3 通过编码实现拟合
  86. 7.4 贝叶斯结构时间序列
  87. 7.5 更多资源
  88. 第8章 时间序列的特征生成与选择
  89. 8.1 入门示例
  90. 8.2 生成特征时需要考虑什么
  91. 8.2.1 时间序列的性质
  92. 8.2.2 领域知识
  93. 8.2.3 外部考虑因素
  94. 8.3 何处寻找特征灵感
  95. 8.3.1 开源时间序列特征生成库
  96. 8.3.2 特定领域的特征示例
  97. 8.4 生成特征后如何进行选择
  98. 8.5 结语
  99. 8.6 更多资源
  100. 第9章 针对时间序列的机器学习
  101. 9.1 时间序列分类
  102. 9.1.1 生成并选择特征
  103. 9.1.2 决策树方法
  104. 9.2 聚类
  105. 9.2.1 由数据生成特征
  106. 9.2.2 具有时间感知能力的距离度量指标
  107. 9.2.3 聚类代码
  108. 9.3 更多资源
  109. 第10章 针对时间序列的深度学习
  110. 10.1 深度学习概念
  111. 10.2 通过编程实现神经网络
  112. 10.3 构建训练流程
  113. 10.3.1 检查数据集
  114. 10.3.2 训练流程的步骤
  115. 10.4 前馈网络
  116. 10.4.1 一个简单示例
  117. 10.4.2 运用注意力机制使前馈网络更具时间意识
  118. 10.5 卷积神经网络
  119. 10.5.1 一个简单的卷积模型
  120. 10.5.2 其他可用的卷积模型
  121. 10.6 循环神经网络
  122. 10.6.1 继续研究用电量示例
  123. 10.6.2 创新:自编码器
  124. 10.7 组合架构
  125. 10.8 结语
  126. 10.9 更多资源
  127. 第11章 测量误差
  128. 11.1 基础知识:如何检验预测结果
  129. 11.2 预测结果何时才算足够好
  130. 11.3 通过模拟估计模型中的不确定性
  131. 11.4 预测多步
  132. 11.4.1 直接拟合感兴趣的范围
  133. 11.4.2 针对较远时间步的递归方法
  134. 11.4.3 对时间序列应用多任务学习
  135. 11.5 模型验证陷阱
  136. 11.6 更多资源
  137. 第12章 拟合及使用时间序列模型时的性能考量
  138. 12.1 使用为一般用例构建的工具
  139. 12.1.1 用于横截面数据的模型不在样本间“共享”数据
  140. 12.1.2 没有预先计算的模型造成数据测量与预测间的非必要延迟
  141. 12.2 数据存储格式的优缺点
  142. 12.2.1 以二进制格式存储数据
  143. 12.2.2 以能够在数据上“滑动”的方式预处理
  144. 12.3 为适应性能考量而修改分析
  145. 12.3.1 使用所有数据不一定更好
  146. 12.3.2 复杂的模型并不总是表现得更好
  147. 12.3.3 简要介绍可用的高性能工具
  148. 12.4 更多资源
  149. 第13章 医疗保健应用
  150. 13.1 流感预测
  151. 13.1.1 案例研究:发生在大都市的流感疫情
  152. 13.1.2 流感预测领域的最新技术
  153. 13.2 血糖水平预测
  154. 13.2.1 探索和清洗数据
  155. 13.2.2 生成特征
  156. 13.2.3 拟合模型
  157. 13.3 更多资源
  158. 第14章 金融应用
  159. 14.1 获取并探索金融数据
  160. 14.2 金融数据预处理与深度学习
  161. 14.2.1 由原始数据生成新指标
  162. 14.2.2 转换数据并避免前瞻
  163. 14.2.3 为神经网络格式化数据
  164. 14.3 构建并训练循环神经网络
  165. 14.4 更多资源
  166. 第15章 政务应用
  167. 15.1 获取政府数据
  168. 15.2 探索时间序列大数据
  169. 15.2.1 在遍历数据时进行上采样并聚合
  170. 15.2.2 对数据排序
  171. 15.3 时间序列数据的在线统计分析
  172. 15.3.1 剩余问题
  173. 15.3.2 后续改进
  174. 15.4 更多资源
  175. 第16章 时间序列工具包
  176. 16.1 规模化预测
  177. 16.1.1 谷歌内部的工业级预测框架
  178. 16.1.2 Facebook的Prophet开源工具包
  179. 16.2 异常检测
  180. 16.3 其他时间序列工具包
  181. 16.4 更多资源
  182. 第17章 关于预测的预测
  183. 17.1 预测即服务
  184. 17.2 深度学习提高了概率
  185. 17.3 重要性正由统计方法向机器学习方法转移
  186. 17.4 更深入地结合统计方法和机器学习方法
  187. 17.5 涉及日常生活的更多预测
书名:时间序列分析实战:基于机器学习和统计学
作者:Aileen Nielsen
译者:王祎, 冯英睿 译
国内出版社:人民邮电出版社
出版时间:2023年01月
页数:515
书号:978-7-115-60544-3
原版书书名:Practical Time Series Analysis
原版书出版商:O'Reilly Media
Aileen Nielsen
 
Aileen Nielsen是来自美国纽约的软件工程师和数据分析师。她毕业于耶鲁大学和普林斯顿大学,从事过多个领域的时间序列研究工作,包括医疗行业、物理学研究和金融行业等。她目前专注于研发用于预测的神经网络。
 
 
本书封面上的动物是一只蓝脸莱斯特绵羊(学名是Ovis aries)。蓝脸莱斯特绵羊是一种英国绵羊品种,它最早于18世纪在莱斯特郡的迪什利繁育。如今,英国和加拿大各地的农民都在培育这种特殊品种的绵羊。
蓝脸莱斯特绵羊的白色羊毛可用于制作精美、有光泽的羊毛织品和高质量的手工纺纱。在蓝灰色面孔的衬托下,蓝脸莱斯特绵羊的棕色眼睛显得格外突出。蓝脸莱斯特绵羊有着健壮的背部、肩膀和颈部,以及宽阔的口鼻和黑色的蹄子。它的腿上和脸上都没有毛。
成年蓝脸莱斯特绵羊的体重介于91千克和109千克之间。公羊从蹄到肩的平均身高为0.91米,母羊则为0.84米。同大多数绵羊一样,蓝脸莱斯特绵羊以青草、野草和鲜花为食。放牧时,羊群中平均有20只母羊。
蓝脸莱斯特绵羊之所以受到追捧,是因为这种羊有一种被业界称为“骡子”的本领。这里的“骡子”是指一种繁殖率高的母羊,饲养者通过将其与其他品种杂交来培育出供给市场的羔羊。
购买选项
定价:139.80元
书号:978-7-115-60544-3
出版社:人民邮电出版社