《Python自然语言处理》—

Python自然语言处理

陈涛, 张旭, 崔杨, 刘海平译

出版时间：2014年06月

页数：508

“少有的一本书，用如此清晰的方法、如此优美整洁的代码处理一个如此复杂的计算机问题……这是一本从中可以学习自然语言处理的书。”
——Ken Getz，MCW Technologies高级顾问

从输入法联想提示（predictive text）、E-mail过滤到自动文本汇总、机器翻译，大量的语言相关的技术都离不开自然语言处理的支持，而这本书提供了自然语言处理的入门指南。通过本书，你将学到如何编写能处理大量非结构化文本的Python程序。你可以访问具有丰富标注的、涵盖了语言学各种数据结构的数据集，而且你将学习分析书面文档的内容和结构的主要算法。

通过大量的例子和练习，本书将帮助你：
· 从非结构化文本中提取信息，无论是猜测主题还是识别“命名实体”；
· 分析文本的语言学结构，包括语法和语义分析；
· 访问流行的语言学数据集，包括WordNet和treebanks；
· 整合从语言学到人工智能等多个领域的技术。

通过使用Python和自然语言工具包（NTLK）的开源库，本书将帮助你增加自然语言处理的实际经验。如果你对开发Web应用、分析多语言的新闻源或记录濒危语言感兴趣，或者只是想要从程序员的视角看人类语言如何运作，你将发现本书不仅有趣而且极其有用。

Steven Bird是墨尔本大学计算机科学和软件工程系副教授，宾夕法尼亚大学语言学数据联盟高级研究助理。
Ewan Klein是爱丁堡大学信息学院语言技术教授。
Edward Loper是毕业于宾夕法尼亚大学专注于机器学习的自然语言处理方向的博士，现在在波士顿的BBN Technologies担任研究员。