Python自然语言处理
Steven Bird, Ewan Klein, Edward Loper
陈涛, 张旭, 崔杨, 刘海平 译
出版时间:2014年06月
页数:508
“少有的一本书,用如此清晰的方法、如此优美整洁的代码处理一个如此复杂的计算机问题……这是一本从中可以学习自然语言处理的书。”
——Ken Getz,MCW Technologies高级顾问

从输入法联想提示(predictive text)、E-mail过滤到自动文本汇总、机器翻译,大量的语言相关的技术都离不开自然语言处理的支持,而这本书提供了自然语言处理的入门指南。通过本书,你将学到如何编写能处理大量非结构化文本的Python程序。你可以访问具有丰富标注的、涵盖了语言学各种数据结构的数据集,而且你将学习分析书面文档的内容和结构的主要算法。

通过大量的例子和练习,本书将帮助你:
· 从非结构化文本中提取信息,无论是猜测主题还是识别“命名实体”;
· 分析文本的语言学结构,包括语法和语义分析;
· 访问流行的语言学数据集,包括WordNet和treebanks;
· 整合从语言学到人工智能等多个领域的技术。

通过使用Python和自然语言工具包(NTLK)的开源库,本书将帮助你增加自然语言处理的实际经验。如果你对开发Web应用、分析多语言的新闻源或记录濒危语言感兴趣,或者只是想要从程序员的视角看人类语言如何运作,你将发现本书不仅有趣而且极其有用。

Steven Bird是墨尔本大学计算机科学和软件工程系副教授,宾夕法尼亚大学语言学数据联盟高级研究助理。
Ewan Klein是爱丁堡大学信息学院语言技术教授。
Edward Loper是毕业于宾夕法尼亚大学专注于机器学习的自然语言处理方向的博士,现在在波士顿的BBN Technologies担任研究员。
  1. 第1章 语言处理与python
  2. 1.1 语言计算:文本和词汇
  3. 1.2 近观python:将文本当做词链表
  4. 1.3 计算语言:简单的统计
  5. 1.4 回到python:决策与控制
  6. 1.5 自动理解自然语言
  7. 1.6 小结
  8. 1.7 深入阅读
  9. 1.8 练习
  10. 第2章 获得文本语料和词汇资源
  11. 2.1 获取文本语料库
  12. 2.2 条件频率分布
  13. 2.3 更多关于python:代码重用
  14. 2.4 词典资源
  15. 2.5 wordnet
  16. 2.6 小结
  17. 2.7 深入阅读
  18. 2.8 练习
  19. 第3章 处理原始文本
  20. 3.1 从网络和硬盘访问文本
  21. 3.2 字符串:最底层的文本处理
  22. 3.3 使用unicode进行文字处理
  23. 3.4 使用正则表达式检测词组搭配
  24. 3.5 正则表达式的有益应用
  25. 3.6 规范化文本
  26. 3.7 用正则表达式为文本分词
  27. 3.8 分割
  28. 3.9 格式化:从链表到字符串
  29. 3.10 小结
  30. 3.11 深入阅读
  31. 3.12 练习
  32. 第4章 编写结构化程序
  33. 4.1 回到基础
  34. 4.2 序列
  35. 4.3 风格的问题
  36. 4.4 函数:结构化编程的基础
  37. 4.5 更多关于函数
  38. 4.6 程序开发
  39. 4.7 算法设计
  40. 4.8 python库的样例
  41. 4.9 小结
  42. 4.10 深入阅读
  43. 4.11 练习
  44. 第5章 分类和标注词汇
  45. 5.1 使用词性标注器
  46. 5.2 标注语料库
  47. 5.3 使用python字典映射词及其属性
  48. 5.4 自动标注
  49. 5.5 n-gram标注
  50. 5.6 基于转换的标注
  51. 5.7 如何确定一个词的分类
  52. 5.8 小结
  53. 5.9 深入阅读
  54. 5.10 练习
  55. 第6章 学习分类文本
  56. 6.1 监督式分类
  57. 6.2 监督式分类的举例
  58. 6.3 评估
  59. 6.4 决策树
  60. 6.5 朴素贝叶斯分类器
  61. 6.6 最大熵分类器
  62. 6.7 为语言模式建模
  63. 6.8 小结
  64. 6.9 深入阅读
  65. 6.10 练习
  66. 第7章 从文本提取信息
  67. 7.1 信息提取
  68. 7.2 分块
  69. 7.3 开发和评估分块器
  70. 7.4 语言结构中的递归
  71. 7.5 命名实体识别
  72. 7.6 关系抽取
  73. 7.7 小结
  74. 7.8 深入阅读
  75. 7.9 练习
  76. 第8章 分析句子结构
  77. 8.1 一些语法困境
  78. 8.2 文法的用途
  79. 8.3 上下文无关文法
  80. 8.4 上下文无关文法分析
  81. 8.5 依存关系和依存文法
  82. 8.6 文法开发
  83. 8.7 小结
  84. 8.8 深入阅读
  85. 8.9 练习
  86. 第9章 建立基于特征的文法
  87. 9.1 文法特征
  88. 9.2 处理特征结构
  89. 9.3 扩展基于特征的文法
  90. 9.4 小结
  91. 9.5 深入阅读
  92. 9.6 练习
  93. 第10章 分析语句的含义
  94. 10.1 自然语言理解
  95. 10.2 命题逻辑
  96. 10.3 一阶逻辑
  97. 10.4 英语语句的语义
  98. 10.5 段落语义层
  99. 10.6 小结
  100. 10.7 深入阅读
  101. 10.8 练习
  102. 第11章 语言数据管理
  103. 11.1 语料库结构:案例研究
  104. 11.2 语料库生命周期
  105. 11.3 数据采集
  106. 11.4 使用xml
  107. 11.5 使用toolbox数据
  108. 11.6 使用olac元数据描述语言资源
  109. 11.7 小结
  110. 11.8 深入阅读
  111. 11.9 练习
  112. 后记
  113. 参考文献
书名:Python自然语言处理
译者:陈涛, 张旭, 崔杨, 刘海平 译
国内出版社:人民邮电出版社
出版时间:2014年06月
页数:508
书号:978-7-115-33368-1
原版书书名:Natural Language Processing with Python
原版书出版商:O'Reilly Media
Steven Bird
 
Steven Bird是墨尔本大学计算机科学和软件工程系副教授,宾夕法尼亚大学语言学数据联盟高级研究助理。
 
 
Ewan Klein
 
Ewan Klein是爱丁堡大学信息学院语言技术教授。
 
 
Edward Loper
 
Edward Loper是毕业于宾夕法尼亚大学专注于机器学习的自然语言处理方向的博士,现在在波士顿的BBN Technologies担任研究员。