初识数据科学
门佳 译
出版时间:2026年03月
页数:563
“我真希望在第一次用‘数据科学家’这个词来描述做我们所做工作的人时能有这本书。如果你想从事数据科学/工程、AI或机器学习,这本书就是你的起点。”
——DJ Patil博士
美国第一位首席数据科学家
作为一名有抱负的数据科学家,你理解为什么组织机构的重要决策都依赖于数据 —— 无论是设计网站的公司、决定如何改善服务的城市,还是致力于阻止疾病传播的科学家组织。你需要具备将一堆杂乱的数据提炼成可操作的洞见所需的技能。我们称之为数据科学生命周期:收集、整理、分析数据并从中得出结论的过程。
本书是第一本兼顾编程和统计学基础技能的书籍,内容涵盖了整个数据科学生命周期。它面向那些希望成为数据科学家或与数据科学家合作的读者,以及希望跨越“技术/非技术”界限的数据分析师。如果具备基本的Python编程知识,你将学到如何使用像pandas这样的行业标准工具来处理数据。
● 将感兴趣的问题提炼为可通过数据研究的问题
● 进行数据收集可能涉及的文本处理、Web抓取等技术
● 通过数据清洗、探索和可视化获得有价值的洞见
● 学习如何使用建模来描述数据
● 将研究结果推广到数据之外
书名:初识数据科学
译者:门佳 译
国内出版社:东南大学出版社
出版时间:2026年03月
页数:563
书号:978-7-5766-1290-5
原版书书名:Learning Data Science
原版书出版商:O'Reilly Media
Sam Lau
Sam Lau是加州大学圣地亚哥分校Halicioglu数据科学研究所的助理教学教授。Sam拥有十年的教学经验,并曾在加州大学伯克利分校和加州大学圣地亚哥分校设计并教授一流的数据科学课程。
Joseph Gonzalez
Joey Gonzalez是加州大学伯克利分校电子工程与计算机科学系副教授,是伯克利人工智能研究组成员,也是伯克利RISE实验室创始成员。他还共同创立了Turi Inc.和Aqueduct,为数据科学家开发各种工具。
Deborah Nolan
Deborah Nolan是加州大学伯克利分校计算机、数据科学和社会学院的统计学名誉教授兼学生事务副院长。
本书封面上的动物是可食用睡鼠(学名:Glis glis)。顾名思义,这种动物确实曾出现在人类的餐桌上。在古罗马时代,烤制食用睡鼠备受青睐,如今在克罗地亚和斯洛文尼亚仍有食用这种动物的习俗。可食睡鼠的体形类似于松鼠:小耳朵、短腿、大脚掌,蓬松的长尾巴。前足四趾,后足五趾,身体大部分覆盖着灰色或灰褐色的毛发,腹部呈白色,足底无毛,能分泌黏性物质辅助攀爬。
这种夜行性动物大部分时间栖息在树上,分布于欧洲以及西亚和中亚的部分地区。虽然国际自然保护联盟(IUCN)将可食用睡鼠列为“无危”物种,但其仍面临非法捕猎和栖息地丧失的威胁。