社交网站的数据挖掘与分析(原书第3版)
苏统华, 郭勇, 潘巍 译
出版时间:2021年01月
页数:347
“基于认知计算技术,数据可以为你带来无限活力。对于那些希望使用现代数据科学方法动手挖掘当前庞大的社交网站数据的人来说,本书是必不可少的。”
——Rohan Khairnar
北卡罗来纳大学夏洛特分校
高级数据和知识发现学院
分析师和数据科学家
“在这个数字时代,从社交网站的虚拟世界中获得真知灼见已成为一项必不可少的技能。对于任何想使用神奇的挖掘和分析技术来善用社交数据的人而言,本书都是完整而简明的指南。”
——Stuthi Parameshwara Rao
北卡罗来纳大学夏洛特分校
信息技术学院数据分析师
本书指导你挖掘隐藏在Twitter、Facebook、LinkedIn、Instagram和GitHub等流行社交网站上的丰富数据。通过这本畅销指南,数据科学家、分析师和程序员将学习如何在Jupyter Notebook或者Docker容器中使用Python代码分析社交媒体中的真知灼见——哪些人正在通过社交媒体进行联系?他们正在谈论什么?他们目前身在何处?
在本书的第一部分,每一章都聚焦社交网站生态的某个具体方面,囊括了各大主流社交网站,也包括了网页、博客和订阅源、邮箱、GitHub以及新增加的Instagram的内容。第二部分提供了实用指南,其中包括超过20个供挖掘Twitter数据之用的简短代码解决方案。
通过阅读本书,你将能够:
● 极速鸟瞰社交网站生态。
● 将每章的代码打包为Jupyter Notebook,并使用Docker轻松运行。
● 借用并活用开源GitHub代码库。
● 了解如何使用Python 3工具对收集的数据条分缕析。
● 使用先进的数据挖掘技术,如TF-IDF、余弦相似度、共现分析、团检测和图像识别。
● 借助Python和JavaScript工具包构建漂亮的数据可视化。
书名:社交网站的数据挖掘与分析(原书第3版)
译者:苏统华, 郭勇, 潘巍 译
国内出版社:机械工业出版社
出版时间:2021年01月
页数:347
书号:978-7-111-67404-7
原版书书名:Mining the Social Web, 3rd Edition
原版书出版商:O'Reilly Media
Matthew A. Russell
马修·罗塞尔(Matthew A. Russell),Digital Reasoning Systems公司的技术副总裁和Zaffra公司的负责人,是热爱数据挖掘、开源和Web应用技术的计算机科学家。他也是《Dojo: The Definitive Guide》(O’Reilly出版社)的作者。在Linkedin上联系他或在Twitter关注@ptwobrussell,可随时了解他的最新动态。
Mikhail Klassen
Mikhail Klassen是Paladin AI公司的联合创始人和首席数据科学家,该公司坐落于蒙特利尔,是面向航空领域提供数据分析服务的初创公司。他的工作是借助数据挖掘和机器学习技术为飞行员设计下一代基于数据驱动的自适应培训方案。