社交网站的数据挖掘与分析(原书第2版)
苏统华, 魏通, 赵逸雪, 王烁行, 刘智月 译
出版时间:2014年12月
页数:368
“不管你是否是程序员,通过API来挖掘见解都是必备的技能。本书展示了大量关键数据源,通过工具,可以令编码变得轻松。”
——Kevin Makice,《Twitter APl: Up and Running》作者
“本书使用简洁的交互式代码向读者展示了社交网站数据的全新视角。所有的这些都可以在浏览器中呈现。通过学习这些广泛的示例,读者可以将探索算法复杂度、自然语言处理以及物联网前景等计算机科学中艰深概念的过程变成一次奇妙的旅行。”
——Jason Yee,Digital Reasoning公司,数据科学家
社交网站数据如同深埋地下的“金矿”,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿?本书第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、
GitHub、邮件、网站和博客等)的数据,以及如何通过可视化找到你一直在社交世界中寻找的内容和你闻所未闻的有用信息。
· 借助IPython Notebook、自然语言工具包、NetworkX和其他科学计算工具挖掘主流社交网站
· 使用高级文本挖掘技术(如聚类和TF-IDF)来提取人类语言数据中有价值的知识
· 通过发现GitHub上人、编程语言和代码工程间的亲密性,构建兴趣图谱
· 利用D3.js进行交互式可视化,充分发挥HTML5和JavaScript工具包的灵活特性
· 以“问题-解决方案-讨论”的方式详细讲解深入挖掘Twitter数据的实用技术,并提供代码示例
本书的配套代码在公开的GitHub代码库中进行维护,可以通过一站式虚拟机来访问,你只需要使用方便易用的IPython Notebook,即可进入愉快的交互式学习情景。
书名:社交网站的数据挖掘与分析(原书第2版)
译者:苏统华, 魏通, 赵逸雪, 王烁行, 刘智月 译
国内出版社:机械工业出版社
出版时间:2014年12月
页数:368
书号:978-7-111-48699-2
原版书书名:Mining the Social Web, 2nd Edition
原版书出版商:O'Reilly Media
Matthew A. Russell
马修·罗塞尔(Matthew A. Russell),Digital Reasoning Systems公司的技术副总裁和Zaffra公司的负责人,是热爱数据挖掘、开源和Web应用技术的计算机科学家。他也是《Dojo: The Definitive Guide》(O’Reilly出版社)的作者。在Linkedin上联系他或在Twitter关注@ptwobrussell,可随时了解他的最新动态。