生物信息学中的计算机技术
生物信息学中的计算机技术
Cynthia Gibas, Per Jambeck
孙超, 郭庆民, 刘相国, 吴斌 译
出版时间:2002年07月
页数:448
生物信息学是一门正在迅速发展的科学,它使用计算和分析方法来解决生物学问题。当前,基因组测序项目正在处理着来自许多不同生物体的大量生物学数据,并且,越来越多地把这些数据保存在公共数据库中。即使是该领域中最积极的研究者,也不可能离开计算机工具的帮助进行工作。生物信息学研究的就是如何建立这些工具。
本书以一种清晰、活泼的方式,全面介绍了生物信息学领域中最重要的一些主题。本书介绍并解释了在生物信息学研究中用到的许多流行软件,并涵盖了一些背景知识,以帮助读者理解如何最好地使用这些工具,以及这些工具之所以重要的原因。
本书包括以下内容:
*建立一个生物信息学工作站
*当前生物学家使用的Unix系统
*在生物序列、基因组和分子结构数据库中搜索信息的计算技术
*用于识别基因的软件工具和用于检测那些识别基因族特征模式的软件工具
*用于系统发育关系、分子结构和生物化学属性建模的软件工具
*自动数据处理和数据分析过程
*建立数据库
*用于数据采集和数据可视化的工具
本书不仅适合初学在生物学中如何使用计算方法的学生阅读,而且适合那些刚开始学习使用计算机来处理数据的有经验的研究者阅读。本书可帮助读者开发一种处理生物学数据的结构化方法,并可帮助读者深入理解自己需要的软件工具。
  1. 前言
  2. 第一部分 概述
  3. 第一章 计算机时代的生物学
  4. 计算是如何改变生物学的?
  5. 生物信息学难道仅仅是建立数据库吗?
  6. 信息学对生物学家意味着什么?
  7. 生物学给计算机科学家提出了哪些挑战?
  8. 生物信息学家应该有什么样的技巧?
  9. 为什么生物学家应使用计算机?
  10. 要进行生物信息学研究应该怎样设置PC机?
  11. 我们能找到什么信息和软件?
  12. 不上课我就能学会一门编程语言吗?
  13. 怎样利用Web信息?
  14. 怎样理解序列比对数据?
  15. 怎样编写一个程序来比对两个生物学序列?
  16. 怎样通过序列来预测蛋白质结构?
  17. 生物信息学能回答什么问题?
  18. 第二章 生物学问题的计算方法
  19. 分子生物学的中心法则
  20. 生物学家要建什么样的模型?
  21. 为什么生物学家要建立模型?
  22. 本书覆盖的计算方法
  23. 一个计算生物学的实验
  24. 第二部分 生物信息学工作站
  25. 第三章 建立工作站
  26. 在Unix操作系统下工作
  27. 建立一个Linux工作站
  28. 如何使软件运行起来
  29. 什么软件是必需的?
  30. 第四章 Unix中的文件和目录
  31. 文件系统基础
  32. 用于目录和文件的命令
  33. 在多用户环境中工作
  34. 第五章 在Unix系统下工作
  35. Unix Shell
  36. 在Unix系统上发布命令
  37. 查看和编辑文件
  38. 转换和过滤器
  39. 文件统计和比较
  40. 正则表达式的语言
  41. Unix Shell脚本
  42. 和其他计算机进行通信
  43. 在共享环境中和其他人轻松交流
  44. 第三部分 生物信息学工具
  45. 第六章 在Web上进行生物学研究
  46. 应用搜索引擎
  47. 查找科学文献
  48. 公共的生物学数据库
  49. 搜索生物学数据库
  50. 在公共的数据库中存储数据
  51. 查找软件
  52. 判断信息的质量
  53. 第七章 序列分析、成对比对以及数据库搜索
  54. 生物分子的化学成分
  55. DNA和RNA的组成
  56. Watson及Crick解决了DNA的结构问题
  57. DNA测序方法的发展
  58. genefinder和DNA特征的检测
  59. DNA翻译
  60. 成对序列比较
  61. 在生物学数据库进行序列查询
  62. 序列分析的多功能工具
  63. 第八章 多序列比对、进化树和简图
  64. 从形态到分子
  65. 多序列比对
  66. 系统发育分析
  67. 简图和基序
  68. 第九章 蛋白质结构的可视化和结构性质的计算
  69. 关于蛋白质结构数据
  70. 蛋白质的化学性质
  71. 基于Web的蛋白质结构工具
  72. 结构可视化
  73. 结构分类
  74. 结构比对
  75. 结构分析
  76. 溶剂可接近性和相互作用
  77. 计算物理化学性质
  78. 结构优化
  79. 蛋白质资源数据库
  80. 把一切结合在一起
  81. 第十章 根据序列预测蛋白质的结构和功能
  82. 蛋白质结构的确定
  83. 预测蛋白质的结构
  84. 从三维到一维
  85. 蛋白质序列中的特征检测
  86. 二级结构预测
  87. 三维结构预测
  88. 把所有的结合在一起:一个蛋白质建模的方案
  89. 小结
  90. 第十一章 基因组学和蛋白质组学工具
  91. 从基因测序到基因组测序
  92. 序列组装
  93. 在Web上访问基因组信息
  94. 注释和分析整个基因组序列
  95. 功能基因组学:新的数据分析挑战
  96. 蛋白质组学
  97. 生化途径数据库
  98. 动力学和生理学建模
  99. 小结
  100. 第四部分 数据库和可视化
  101. 第十二章 用Perl进行数据自动化分析
  102. 为什么选择Perl?
  103. Perl基础
  104. 模式匹配和正则表达式
  105. 使用Perl解析BLAST输出
  106. Perl在生物信息学中的应用
  107. 第十三章 构建生物学数据库
  108. 数据库类型
  109. 数据库软件
  110. SQL概论
  111. 安装MySQL DBMS
  112. 数据库设计
  113. 开发与数据库互动的基于Web的软件
  114. 第十四章 可视化和数据采集
  115. 准备数据
  116. 浏览图形
  117. 序列数据可视化
  118. 网络和途径可视化
  119. 处理数字数据
  120. 可视化:小结
  121. 数据采集和生物学信息
  122. 参考文献
  123. 词汇表
书名:生物信息学中的计算机技术
译者:孙超, 郭庆民, 刘相国, 吴斌 译
国内出版社:中国电力出版社
出版时间:2002年07月
页数:448
书号:7-5083-1052-7
原版书出版商:O'Reilly Media
Cynthia Gibas
 
Cynthia Gibas是位于弗吉尼亚州Blackburg的弗吉尼亚理工学院的生物学副教授。她在计算生物学受到青睐之前就已经是计算生物学家了。目前她正在推动全新的家庭Linux集群。她的研究兴趣包括基因组结构和进化、蛋白质表面和界面特性,以及蛋白质结构预测。她为生物学家们讲授生物信息学方法的课程。她正期盼着下一个假期的来临,可能在2006年的某个时候。
Cynthia Gibas is an assistant professor of biology at Virginia Tech, in Blacksburg,Virginia. She's been a computational biologist since before computational biology was cool, and is currently learning to drive her spankin' new home-built Linux cluster. Her research interests include the structure and evolution of genomes, the properties of protein surfaces and interfaces, and prediction of protein structure. She teaches introductory courses in bioinformatics methods for biologists and islooking forward to her next real vacation, sometime in 2006.
 
 
Per Jambeck
 
Per Jambeck是加州大学圣迭戈分校生物工程系的博士研究生。他从1994年开始从事计算生物学的研究,兴趣主要集中在如何将机器学习应用于多维生物学数据的理解。在谈及空闲时间时,Per总是充满渴望地微笑着,他时常组织主持社区演出和学生广播站。
Per Jambeck is a Ph.D. student in the bioengineering department at the University of California, San Diego. He has worked on computational biology problems since 1994, concentrating on machine learning applications in understanding multidi-mensional biological data. Per smiles wistfully at the mention of free time, but he manages to host shows at community and student-run radio stations anyway.
 
 
本书封面上的动物是一种很小的线虫,Caenorhabditis elegan,与它的那些肮脏的近亲不同,这种线虫生活在土壤中,靠微生物和细菌为生。它大概能长到1毫米长。
尽管是一种原始的生物,这种动物在本质上却和人类有着许多相同的生物学特征。C. elegan的生命是从单细胞开始的,经分裂长成多细胞的成熟个体。它有神经系统和脑(更确切地说是围咽环,circumpharyngeal ring)以及支持运动的肌肉系统。它有一定的行为,能进行简单的学习。与人类一样,它也分为两性,但它分为雄性和自体受精的雌雄同体。C. elegan在实验室条件下很容易大量生长,寿命只有短短的2~3周,可在复杂的实验中对它进行操作。这些特性使得它成为进行科学研究的理想生物。
雌雄同体的C. elegan有959个细胞,300个是神经元,81个是肌肉细胞。通过发育学研究,完整的细胞世系已经搞清楚了。成体头部有大量感受味觉、嗅觉、触觉和温度的感觉器官。虽然没有眼睛,但它对光有轻微的反应。C. elegan有大概17800个不同的基因,它的基因组已全部测序。与果蝇、小鼠、拟南芥菜一起,C. elegan已成为自Sydney Brenner几十年前首次注意这种生物以来、生物学中最常见的模式生物之一。