Python文本分析
马晶慧 译
出版时间:2022年08月
页数:421
“我多么希望在刚开始从事研究的时候就拥有本书。作者的文字功底非常扎实,每个案例都经过了精心研究,很容易上手,有机器学习使用需求的业务都可以利用这些案例。”
——K.V.S. Dileep
GreyAtom教育计划开发主管
将文本转换成有价值的信息是企业寻求竞争优势的关键。随着近年来自然语言处理(NLP)的发展,如今用户可以通过各种方式来解决复杂的难题。但用户不清楚选择何种NLP工具或库才能满足业务需求,他们不知道应该使用何种技术以及按照怎样的顺序使用这些技术。
这本实战手册为数据科学家和开发人员提供了文本分析与自然语言处理中常见任务的最佳实践解决方案。书中介绍了各种Python真实案例研究,并提供了详细的代码示例,可以帮助你快速入门。
● 提取API与网页的数据。
● 统计分析和机器学习的文本数据预处理。
● 机器学习分类、主题建模与摘要。
● 解释AI模型与分类的结果。
● 利用单词嵌入,探索及可视化语义相似性。
● 分析产品评论中的客户情感。
● 根据命名实体及其关系创建知识图。
书名:Python文本分析
译者:马晶慧 译
国内出版社:中国电力出版社
出版时间:2022年08月
页数:421
书号:978-7-5198-6444-6
原版书书名:Blueprints for Text Analytics Using Python
原版书出版商:O'Reilly Media
Jens Albrecht
Jens Albrecht是纽伦堡理工学院计算机科学系的全职教授。主要从事数据管理与分析领域的研究,尤其侧重于文本分析。他拥有计算机科学博士学位。2012年,他重新加入学术圈,在这之前他在该行业工作了十多年,曾担任顾问和数据架构师。他发表了很多有关大数据管理与分析的文章。
Sidharth Ramachandran
Sidharth Ramachandran目前负责领导一个数据科学家团队,主要为消费品行业构建数据产品。他拥有十多年电信、银行以及市场营销等领域软件工程与数据科学的工作经验。他是WACAO的合伙创始人(WACAO是一款WhatsApp上的智能个人助理,Techcrunch曾介绍过该应用)。他拥有IIT Roorkee的工程学学士学位以及IIM Kozhikode的MBA学位。他热衷于通过技术解决实际问题,业余时间他喜欢钻研个人项目。
Christian Winkler
Christian Winkler是一位数据科学家与和机器学习架构师。他拥有理论物理学博士学位,在大数据与人工智能领域工作了20多年。尤其专注于可扩展系统以及大规模文本处理的智能算法。他是datanizing GmbH的创始人,他喜欢在大会上发表演讲,而且还发表了多篇机器学习/文本分析的文章。
本书封面上的动物是彩锯鳞蝰(英文名:Palestine saw-scaled viper,拉丁学名:Echis coloratus)。
这种毒蛇主要分布于中东和非洲东北部地区。在内盖夫以及朱迪亚沙漠地带的岩质沙漠中,这种毒蛇很常见,从海平面到海拔2500米以上的栖息地中都可以见到它们的身影。这种毒蛇的头部呈三角锥状,周身黄褐色,背面呈独特的锯齿形图案。身长最大可至75厘米,它会根据热源寻找猎物。