Java数据科学实战
姜建锦, 赵绪营, 张岩 译
出版时间:2020年04月
页数:186
“这是一本不可多得的、采用Java来实现与应用数据科学的书。书中对机器学习所需的线 性代数和统计学的讨论简洁有力。本书汇集了布茹斯托维奇在该领域的丰富实战经验,我强烈推荐。”
——Terence Parr
旧金山大学计算机科学和数据科学教授,语法分析器生成工具ANTLR之父
数据科学近年来迅速成为了热门研究领域,但很少有数据科学从业人士冒险涉足Java世界。考虑到在工程与科学的交叉地带所需的可伸缩性、稳健性以及便利性,Java其实是一门理想的语言。本书将循序渐进地引导读者进入数据科学的工作流程,在解释数学原理的同时给出代码示例。书中解释了数据科学流程每一步背后的基本数学原理,以及如何采用Java来应用这些原理。
本书内容涉及数据输入与输出、线性代数、统计学、数据操作、学习与预测,以及Hadoop MapReduce在这个过程中所扮演的关键角色。
● 讨论获取数据、清理数据,以及以纯粹方式排列数据的众多方法
● 理解数据应采用的矩阵结构
● 学习测试数据来源及数据有效性的基本概念
● 把数据转换为稳定且可用的数值
● 理解监督型学习算法与无监督型学习算法,以及评估这些算法是否成功的方法
● 采用适合数据科学算法的定制组件,设置和运行MapReduce任务
书名:Java数据科学实战
译者:姜建锦, 赵绪营, 张岩 译
国内出版社:人民邮电出版社
出版时间:2020年04月
页数:186
书号:978-7-115-53330-2
原版书书名:Data Science with Java
原版书出版商:O'Reilly Media
Michael R. Brzustowicz
迈克尔·R.布茹斯托维奇(Michael R. Brzustowicz),从研究物理的博士后转型为经验丰富的数据科学家,专注于建立分布式数据系统,并从海量数据中提取知识。他大部分的时间都在编写(日常大数据问题的)统计模型方法及机器学习方法的定制多线程代码。他是多家创业公司的合伙人,并在旧金山大学担任兼职教授。