基于Spark NLP的自然语言处理
唐晓, 胡乔林, 陈新 译
出版时间:2022年09月
页数:386
“这是一本写得很好的书,它将带你从语法和语言模型的基础知识开始,并利用当今可用的最佳深度学习和迁移学习技术,构建现实世界的生产级AI应用程序。”
——David Talby
John Snow 实验室CTO
如果你想构建一个使用自然语言文本的企业级应用程序,但不确定从哪里开始或使用什么工具,本书将帮助你入门。Wisecube的首席数据科学家Alex Thomas向软件工程师和数据科学家展示了如何使用深度学习和Apache Spark NLP库,来构建可扩展的自然语言处理(NLP)应用程序。
通过在Spark处理框架上使用NLP的具体示例、实践,进行理论解释和动手练习,本书将会介绍从基本语言学和写作系统到情感分析和搜索引擎的所有内容。你还将探索一些开发基于文本的应用程序会遇到的特殊问题,例如性能等。在下面四个部分中,你将学习NLP基础知识和构建模块,然后再深入研究应用程序和系统构建:
● 基础知识:了解自然语言处理、Apache Spark上的NLP和深度学习的基础知识。
● 构建模块:学习构建 NLP 应用程序的技术(包括标记化、句子分割和命名实体识别),并了解它们的工作方式和原因。
● 应用程序:探索构建你自己的NLP应用程序的设计、开发和实验过程。
● 构建NLP系统:考虑生产和部署NLP模型的选项,包括支持哪些人类语言。
书名:基于Spark NLP的自然语言处理
译者:唐晓, 胡乔林, 陈新 译
国内出版社:中国电力出版社
出版时间:2022年09月
页数:386
书号:978-7-5198-6967-0
原版书书名:Natural Language Processing with Spark NLP
原版书出版商:O'Reilly Media
Alex Thomas
Alex Thomas是Wisecube的首席数据科学家。他将自然语言处理和机器学习与临床数据、身份数据、雇主和求职者数据,以及现在的生物化学数据结合使用。Alex从Apache Spark 0.9版就开始使用,并使用过NLP库和框架,其中包括UIMA和OpenNLP。
本书封面上的动物是叫隼(学名:Milvago chimango),属于隼科的猛禽。
叫隼生活在南美洲灌木丛中,通常在水边,靠近城镇和田野。它们成群结队地生活,具有侵略性和领地意识。它们经常追逐较大的猛禽。
雄性和雌性叫隼都会筑巢并保护巢穴,孵化和喂养幼鸟。这些鸟吃昆虫、脊椎动物和腐肉,它们还可以在水面上捕鱼。
叫隼在其栖息地是比较常见的。O’Reilly封面上的许多动物濒临灭绝,所有这些对世界都很重要。