Python与R语言数据科学实践
黄德滨 译
出版时间:2023年10月
页数:151
“您将了解这些程序的起源,以及如何用真正的互操作性来进行补充。”
——George Mount
Stringfest Analytics首席执行官
“这本书提供了一个基础模板,展示如何用任何一种语言完成任务。”
——Noah Gift
Pragmatic AI实验室创始人
在数据科学领域,成功取决于工具的灵活和恰当的使用。Python和R是该领域的两种基本编程语言。本书将引导Python 和R社区的数据科学家掌握两种语言,通过认识到它们各自的优势来发现完成数据科学任务的新方法并扩展技能。
本书的两位作者解释了Python和R的并行结构,并强调了每种语言在语言特征及开源生态系统方面的优点。您将学习如何在实际环境中同时使用Python和R。
● 从当前使用的语言的角度学习Python和R
● 了解两种语言的优点和缺点
● 确定一种语言比另一种语言更适合的用例
● 了解两种语言都可用的现代开源生态系统,包括软件包、框架和工作流
● 学习如何将R和Python集成到单个工作流中
● 通过一个案例,学习如何同时使用这两种语言
- 前言
- 第I部分 探索新的语言
- 第1章 概述
- 1.1 R的起源
- 1.2 Python的起源
- 1.3 语言战争的开端
- 1.4 数据科学主导权之战
- 1.5 合作与社区建设的融合
- 1.6 最后的想法
- 第II部分 两种编程语言I:新学习一门语言
- 第2章 针对Python用户的R
- 2.1 启动和运行R
- 2.2 项目和第三方库
- 2.3 Tibbles的胜利
- 2.4 关于数据类型和数据探索
- 2.5 关于命名(内部)
- 2.6 列表
- 2.7 关于因子
- 2.8 如何查找
- 2.9 重复迭代
- 2.10 最后的想法
- 第3章 针对R用户的Python
- 3.1 版本和构建
- 3.2 标准工具
- 3.3 虚拟环境
- 3.4 安装第三方库
- 3.5 笔记本
- 3.6 从编程语言角度对比Python和R
- 3.7 导入数据集
- 3.8 检查数据
- 3.9 数据结构和描述性统计
- 3.10 数据结构:回归基础
- 3.11 索引和逻辑表达式
- 3.12 绘图
- 3.13 推理统计
- 3.14 最后的想法
- 第III部分 两种编程语言II:现代的环境
- 第4章 数据格式环境
- 4.1 外部第三方库与基础库
- 4.2 图像数据
- 4.3 文本数据
- 4.4 时间序列数据
- 4.4.1 基础R
- 4.4.2 Prophet第三方库
- 4.5 空间数据
- 4.6 最后的想法
- 第5章 工作流程环境
- 5.1 定义工作流程
- 5.2 探索式数据分析
- 5.2.1 统计可视化
- 5.2.2 交互可视化
- 5.3 机器学习
- 5.4 数据工程
- 5.5 报表
- 5.5.1 静态报表
- 5.5.2 互动式报表
- 5.6 最后的想法
- 第IV部分 两种编程语言III:学会协同
- 第6章 协同使用两种语言
- 6.1 虚拟的互操作性
- 6.2 互操作性
- 6.3 深入互操作性
- 6.3.1 在R Markdown文档中R和Python之间传递对象
- 6.3.2 在R Markdown文档中调用Python
- 6.3.3 使用来源命令调用Python
- 6.3.4 使用REPL调用Python
- 6.3.5 在交互式文档中使用动态输入调用Python
- 6.4 最后的想法
- 第7章 两种编程语言数据科学案例研究
- 7.1 24年188万场野火
- 7.2 设置和导入数据
- 7.3 EDA和数据可视化
- 7.4 机器学习
- 7.4.1 设置Python环境
- 7.4.2 特征工程
- 7.4.3 模型训练
- 7.5 推理和用户界面
- 7.6 最后的想法
- 附录 Python-R双语词典
- 第三方库管理
- 赋值运算符
- 类型
- 数学运算符
- 属性
- 关键字
- 函数和方法
- 编码风格和命名约定
- 数据存储对象类比
- 数据帧
- 逻辑表达式
- 索引
书名:Python与R语言数据科学实践
译者:黄德滨 译
国内出版社:人民邮电出版社
出版时间:2023年10月
页数:151
书号:978-7-115-61071-3
原版书书名:Python and R for the Modern Data Scientist
原版书出版商:O'Reilly Media
Rick J. Scavetta
里克·J. 斯卡韦塔(Rick J. Scavetta),宏观经济学家、顾问、数据科学家。自2012年以来一直担任研讨会培训师和自由职业数据科学家。作为斯卡维塔学院的一员,与德国多个主要研究机构保持着紧密和经常性的联系。
Boyan Angelov
博扬·安格洛夫(Boyan Angelov),资深数据策略师和顾问,擅长数据科学、工程和战略方向。拥有近十年的学术和行业环境经验,涉及多个主题,如生物信息学、临床试验、 HRTech和管理咨询等。