R语言经典实例
Paul Teetor
李洪成, 朱文佳, 沈毅诚 译
出版时间:2013年04月
页数:406
“本书不仅是一本解决方案手册,也提供了一种真正令人愉悦的学习R的方法——每次给出一个实际的例子,非常容易阅读!”
——Jeffrey Ryan,软件咨询专家和R添加包作者
“带着95%的信心,我不能拒绝
‘本书是学习、应用R中的统计功能的最好的教材’这一结论。”
—— JD Long,CerebralMastication.com上的R博客作者
本书涵盖200多个R语言实用方法,可以帮助读者快速而有效地使用R进行数据分析。R语言给我们提供了统计分析的一切工具,但是R本身的结构可能有些难于掌握。本书提供的这些面向任务、简明的R语言方法包含了从基本的分析任务到输入和输出、常用统计分析、绘图、线性回归等内容,它们可以让你马上应用R高效地工作。
每一个R语言方法都专注于一个特定的问题,随后的讨论则对问题的解决方案给出解释,并阐释该方法的工作机理。对于R的初级用户,本书将帮助你步入R的殿堂;对于R的资深用户,本书将加深你对R的理解并拓展你的视野。通过本书,你可以使你的分析工作顺利完成并学习更多R语言知识。
本书主要内容:
· 建立向量,处理变量,以及执行其他基本函数。
· 数据的输入和输出。
· 处理矩阵、列表、因子和数据框等数据结构。
· 分析概率、概率分布和随机变量。
· 计算统计量和置信区间,进行统计检验。
· 创建各种图形。
· 构建线性回归和方差分析(ANOVA)等统计模型。
· 探索高级统计技术,如聚类分析等。
Paul Teetor是一位定量分析专家,他曾获统计学硕士学位和计算机科学硕士学位。他擅长投资管理、证券交易和风险管理等领域的分析与软件工程。
  1. 前言
  2. 第1章 R入门和获得帮助
  3. 1.1 下载和安装R软件
  4. 1.2 开始运行R软件
  5. 1.3 输入R命令
  6. 1.4 退出R
  7. 1.5 中断R正在运行的程序
  8. 1.6 查看帮助文档
  9. 1.7 获取函数的帮助文档
  10. 1.8 搜索帮助文档
  11. 1.9 查看R软件包帮助信息
  12. 1.10 通过网络获取帮助
  13. 1.11 寻找相关函数与数据包
  14. 1.12 查询邮件列表
  15. 1.13 向邮件列表提交问题
  16. 第2章 基础知识
  17. 2.1 显示内容
  18. 2.2 设定变量
  19. 2.3 列出所有变量
  20. 2.4 删除变量
  21. 2.5 生成向量
  22. 2.6 计算基本统计量
  23. 2.7 生成数列
  24. 2.8 向量比较
  25. 2.9 选取向量中的元素
  26. 2.10 向量的计算
  27. 2.11 运算符优先级问题
  28. 2.12 定义函数
  29. 2.13 减少输入,得到更多命令
  30. 2.14 常见错误
  31. 第3章 R软件导览
  32. 3.1 获取和设定工作目录
  33. 3.2 保存工作空间
  34. 3.3 查看历史命令记录
  35. 3.4 保存先前命令产生的结果
  36. 3.5 显示搜索路径
  37. 3.6 使用R包中的函数
  38. 3.7 使用R的内置数据集
  39. 3.8 查看已安装的R包列表
  40. 3.9 从CRAN网站安装R包
  41. 3.10 设定默认CRAN网站镜像
  42. 3.11 隐藏启动信息
  43. 3.12 运行脚本
  44. 3.13 批量运行R代码
  45. 3.14 获取和设定环境变量
  46. 3.15 找到R的主目录
  47. 3.16 R的客户化
  48. 第4章 输入与输出
  49. 4.1 使用键盘输入数据
  50. 4.2 显示更少的位数(或更多的位数)
  51. 4.3 将输出结果重定向到某一文件
  52. 4.4 显示文件列表
  53. 4.5 解决无法在Windows中打开文件的问题
  54. 4.6 阅读固定宽度数据记录
  55. 4.7 读取表格数据文件
  56. 4.8 读取CSV文件
  57. 4.9 写入CSV文件
  58. 4.10 从网络中读取表格或CSV格式数据
  59. 4.11 读取HTML表格数据
  60. 4.12 读取复杂格式数据文件
  61. 4.13 读取MySQL数据库中的数据
  62. 4.14 保存和传送目标
  63. 第5章 数据结构
  64. 5.1 对向量添加数据
  65. 5.2 在向量中插入数据
  66. 5.3 理解循环规则
  67. 5.4 构建因子(即分类变量)
  68. 5.5 将多个向量合并成单个向量以及平行因子
  69. 5.6 创建列表
  70. 5.7 根据位置选定列表元素
  71. 5.8 根据名称选定列表元素
  72. 5.9 构建一个名称/值关联表
  73. 5.10 从列表中移除元素
  74. 5.11 将列表转换为向量
  75. 5.12 从列表中移除取值为空值(即NULL)的元素
  76. 5.13 使用条件来移除列表元素
  77. 5.14 矩阵初始化
  78. 5.15 执行矩阵运算
  79. 5.16 将描述性名称赋给矩阵的行和列
  80. 5.17 从矩阵中选定一行或一列
  81. 5.18 用列数据初始化数据框
  82. 5.19 由行数据初始化数据框
  83. 5.20 添加行至数据框
  84. 5.21 预分配数据框
  85. 5.22 根据位置选择数据框的列
  86. 5.23 根据列名选定数据框的列
  87. 5.24 更便捷地选定行和列
  88. 5.25 修改数据框的列名
  89. 5.26 编辑数据框
  90. 5.27 从数据框中移除NA值
  91. 5.28 根据名称排除列
  92. 5.29 合并两个数据框
  93. 5.30 根据共有列合并数据框
  94. 5.31 更便捷地访问数据框内容
  95. 5.32 基本数据类型之间的转换
  96. 5.33 不同结构化数据类型间的转换
  97. 第6章 数据转换
  98. 6.1 向量分组
  99. 6.2 将函数应用于每个列表元素
  100. 6.3 将函数应用于每行
  101. 6.4 将函数应用于每列
  102. 6.5 将函数应用于组数据
  103. 6.6 将函数应用于行组
  104. 6.7 将函数应用于平行向量或列表
  105. 第7章 字符串和日期
  106. 7.1 获取字符串长度
  107. 7.2 连接字符串
  108. 7.3 提取子串
  109. 7.4 根据分隔符分割字符串
  110. 7.5 替代子串
  111. 7.6 查看字符串中的特殊字符
  112. 7.7 生成字符串的所有成对组合
  113. 7.8 得到当前日期
  114. 7.9 转换字符串为日期
  115. 7.10 转换日期为字符串
  116. 7.11 转化年、月、日为日期
  117. 7.12 得到儒略日期
  118. 7.13 提取日期的一部分
  119. 7.14 创建日期序列
  120. 第8章 概率
  121. 8.1 计算组合数
  122. 8.2 生成组合
  123. 8.3 生成随机数
  124. 8.4 生成可再生的随机数
  125. 8.5 生成随机样本
  126. 8.6 生成随机序列
  127. 8.7 随机排列向量
  128. 8.8 计算离散分布的概率
  129. 8.9 计算连续分布的概率
  130. 8.10 转换概率为分位数
  131. 8.11 绘制密度函数
  132. 第9章 统计概论
  133. 9.1 汇总数据
  134. 9.2 计算相对频数
  135. 9.3 因子制表和列联表创建
  136. 9.4 检验分类变量独立性
  137. 9.5 计算数据集的分位数(和四分位数)
  138. 9.6 求分位数的逆
  139. 9.7 数据转换为z分数
  140. 9.8 检验样本均值(t检验)
  141. 9.9 均值的置信区间
  142. 9.10 中位数的置信区间
  143. 9.11 检验样本比例
  144. 9.12 比例的置信区间
  145. 9.13 检验正态性
  146. 9.14 游程检验
  147. 9.15 比较两个样本的均值
  148. 9.16 比较两个非参数样本的位置
  149. 9.17 检验相关系数的显著性
  150. 9.18 检验组的等比例
  151. 9.19 组均值间成对比较
  152. 9.20 检验两样本的相同分布
  153. 第10章 图形
  154. 10.1 创建散点图
  155. 10.2 添加标题和标签
  156. 10.3 添加网格
  157. 10.4 创建多组散点图
  158. 10.5 添加图例
  159. 10.6 绘制散点图的回归线
  160. 10.7 多变量散点图的绘制
  161. 10.8 创建每个因子水平的散点图
  162. 10.9 创建条形图
  163. 10.10 对条形图添加置信区间
  164. 10.11 给条形图上色
  165. 10.12 绘制过点x和y的线
  166. 10.13 改变线的类型、宽度或者颜色
  167. 10.14 绘制多个数据集
  168. 10.15 添加垂直线和水平线
  169. 10.16 创建箱线图
  170. 10.17 对每个因子水平创建箱线图
  171. 10.18 创建直方图
  172. 10.19 对直方图添加密度估计
  173. 10.20 创建离散直方图
  174. 10.21 创建正态Q-Q图
  175. 10.22 创建其他Q-Q图
  176. 10.23 用多种颜色绘制变量
  177. 10.24 绘制函数
  178. 10.25 图形间暂停
  179. 10.26 在一页中显示多个图形
  180. 10.27 打开另一个图形窗口
  181. 10.28 在文档中绘制图形
  182. 10.29 改变图形参数
  183. 第11章 线性回归和方差分析
  184. 11.1 简单线性回归
  185. 11.2 多元线性回归
  186. 11.3 得到回归统计量
  187. 11.4 理解回归的汇总结果
  188. 11.5 运行无截距的线性回归
  189. 11.6 运行有交户项的线性回归
  190. 11.7 选择最合适的回归变量
  191. 11.8 对数据子集回归
  192. 11.9 在回归公式中使用表达式
  193. 11.10 多项式回归
  194. 11.11 转换数据的回归
  195. 11.12 寻找最佳幂变换
  196. 11.13 回归系数的置信区间
  197. 11.14 绘制回归残差
  198. 11.15 诊断线性回归
  199. 11.16 识别有影响的观察值
  200. 11.17 残差自相关检验
  201. 11.18 预测新值
  202. 11.19 建立预测区间
  203. 11.20 运行单因素方差分析
  204. 11.21 创建交互关系图
  205. 11.22 找到组间均值的不同
  206. 11.23 执行稳健方差分析
  207. 11.24 运用方差分析比较模型
  208. 第12章 有用的方法
  209. 12.1 查看你的数据
  210. 12.2 拓宽你的输出
  211. 12.3 输出赋值结果
  212. 12.4 对行和列求和
  213. 12.5 按列输出数据
  214. 12.6 对数据分级
  215. 12.7 找到特定值的位置
  216. 12.8 每隔n个选定一个向量元素
  217. 12.9 找到成对的最小值或者最大值
  218. 12.10 生成多个因子的组合
  219. 12.11 转换一个数据框
  220. 12.12 对数据框排序
  221. 12.13 对两列排序
  222. 12.14 移除变量属性
  223. 12.15 显示对象的结构
  224. 12.16 代码运行时间
  225. 12.17 抑制警告和错误消息
  226. 12.18 从列表中提取函数参数
  227. 12.19 定义你自己的二元运算符
  228. 第13章 高级数值分析和统计方法
  229. 13.1 最小化或者最大化一个单参数函数
  230. 13.2 最小化或者最大化多参数函数
  231. 13.3 计算特征值和特征向量
  232. 13.4 主成分分析
  233. 13.5 简单正交回归
  234. 13.6 数据的聚类
  235. 13.7 预测二元变量(逻辑回归)
  236. 13.8 统计量的自助法
  237. 13.9 因子分析
  238. 第14章 时间序列分析
  239. 14.1 表示时间序列
  240. 14.2 绘制时序图
  241. 14.3 提取最老的观测值或者最新的观测值
  242. 14.4 选取时间序列的子集
  243. 14.5 合并多个时间序列
  244. 14.6 缺失时间序列的填充
  245. 14.7 时间序列的滞后
  246. 14.8 计算逐次差分
  247. 14.9 时间序列相关的计算
  248. 14.10 计算移动平均
  249. 14.11 在日历时间范围内应用函数
  250. 14.12 应用滚动函数
  251. 14.13 绘制自相关函数图
  252. 14.14 检验时间序列的自相关
  253. 14.15 绘制偏自相关函数
  254. 14.16 两个时间序列间的滞后相关性
  255. 14.17 剔除时间序列的趋势
  256. 14.18 拟合ARIMA模型
  257. 14.19 剔除ARIMA模型中不显著的系数
  258. 14.20 对ARIMA模型进行诊断
  259. 14.21 用ARIMA模型进行预测
  260. 14.22 均值回归的检验
  261. 14.23 时间序列的平滑
书名:R语言经典实例
作者:Paul Teetor
译者:李洪成, 朱文佳, 沈毅诚 译
国内出版社:机械工业出版社
出版时间:2013年04月
页数:406
书号:978-7-111-42021-7
原版书书名:R Cookbook
原版书出版商:O'Reilly Media
Paul Teetor
 
Paul Teetor是一位定量分析专家,他曾获统计学和计算机双硕士。他专长于投资管理、证券交易和风险管理等领域的分析与软件工程。他为大芝加哥地区的对冲基金、做市商和组合管理人工作。
 
 
在本书封面的动物是哈比鹰(Harpia Harpyja)。它是世界上的50种鹰类中的一种,是中美洲和南美洲热带雨林的当地动物,它们喜欢栖息在树冠的上部。其属名和种名是指古希腊神话中的鹰身女妖,即一种面部为女人而身体为鹰的恶性精灵。
一般而言,哈比鹰重约18磅,长为36~40英寸,其翼展开约万为6~7英尺,雌性总是比雄性要大一些。然而,两种性别的哈比鹰的羽毛是一样的,它们的上半部大多是瓦黑色,下半部多是白色或者浅灰色。它们浅灰色的头部具有双波峰的大羽毛,当显示敌意时,可以立起波峰。
哈比鹰是一夫一妻制,它们每2~3年仅仅养育一只雏鹰。雌性哈比鹰通常一次产两只卵,第一只卵孵化之后,第2只卵就弃之不管,不再孵化了。尽管雏鹰在6个月内就可以飞行了,但其父母都会继续照顾和喂养它至少一年。由于这种很低的种群生长率,哈比鹰极易因为栖息地被破坏或者人类的捕猎而受到损失。在其范围内,该动物的保护状态从危险到严重濒临灭绝。