云端基因组学
杜春晓 译
出版时间:2022年04月
页数:484
近年来,基因组学领域数据激增。未来几年,美国国立卫生研究院(NIH)等机构将托管50多拍字节(或5000多万吉字节)的基因组数据。它们已开始利用云基础设施托管数据,以便将其开放给研究社区使用。你如何改进基因组分析工具和协议,才能访问和分析云端海量数据?
本书紧贴工作实际,研究者可从本书学到如何用基因组分析工具集GATK、Docker容器、WDL语言和Terra平台等开源工具编制和运行基因组学分析算法。作者Geraldine A. Van der Auwera长期管理GATK用户社区,作者Brian D. O’Connor则来自加利福尼亚大学圣克鲁兹分校基因组研究所。阅读本书的过程,就仿佛是两位专家带你完成云端基因组分析项目。你将学习用基因组学分析算法处理真实数据。
本书主要内容如下:
● 基因组学和计算科学背景知识。
● 云计算操作基础。
● 带你入门GATK和三个主要GATK最佳实践流水线。
● 用WDL语言编写工作流,用Cromwell系统管理工作流,实现自动分析。
● 用并行技术在云端大规模执行工作流,降低成本。
● 在云端用Jupyter笔记本做交互分析。
● 用Terra平台实现安全协作和计算可复现。
书名:云端基因组学
译者:杜春晓 译
国内出版社:中国电力出版社
出版时间:2022年04月
页数:484
书号:978-7-5198-6442-2
原版书书名:Genomics in the Cloud
原版书出版商:O'Reilly Media
Geraldine A. Van der Auwera
Geraldine A. Van der Auwera博士是博德研究所数据科学平台(Outreach and Communications for the Data Sciences Platform,DSP)的外联和通信主任。该研究所由麻省理工学院和哈佛大学联合创办。作为外联,她担负教育和倡导研究者使用DSP软件和服务的职责,帮助研究者使用博德研究所行业领先的变异发现分析工具集GATK、Cromwell/WDL工作流管理系统和云分析平台Terra.bio。Terra平台整合计算资源、方法库和数据管理工具,其工作环境对用户非常友好。Van der Auwera原是微生物学家,2007年从比利时鲁汶大学获得生物工程博士学位,随后到哈佛医学院做了四年博士后。她于2012年加入博德研究所,成为GATK用户社区仁慈的独裁者,永远告别工作台和移液器。
Brian D. O’Connor
Brian D. O’Connor博士是加利福尼亚大学圣克鲁兹分校(UCSC)基因组研究所计算基因组平台(Computational Genomics Platform)主任。他重点研究基因组数据分析所用的大规模和基于云的系统的开发和部署,其中包括NHGRI AnVIL和NHLBI Bio Data Catalyst平台以及工作流和工具分享站点Dockstore。Brian积极从事标准制定工作。他担任全球基因组学和健康联盟云工作流(Global Alliance for Genomics and Health Cloud Work Stream)的联合主席,从事API标准制定工作,以实现云端互操作。Brian从加拿大安大略癌症研究所加入UCSC。他之前从事的项目包括:带队开发全基因组泛癌分析(PanCancer Analysis of Whole Genomes)项目,实现全球性云端分析系统,创建Dockstore站点,并成功重建国际癌症基因组联盟(International Cancer Genome Consortium)的数据门户。
本书封面的动物是一种生有牛奶斑点的四齿鲀科鱼类(凹鼻鲀,学名Chelonodon patoca),原见于印度洋—太平洋地区的江河入海口、红树林、沿海地区和淡盐水区域,现今在这些区域仍有分布。四齿鲀科鱼类又称河豚(blowfish),它们以其富有弹性的腹部而闻名,腹部膨胀可阻挡捕食者。
生有牛奶斑点的这种鲀,就像四齿鲀科其他鱼类一样,其皮肤也含毒素。其皮肤上的粘液层对人和其他捕食者有剧毒。其鳞片呈棕灰色,生有深色条纹和白斑。其腹部为白色,带点浅黄,眼睛有一个黄环。成年凹鼻鲀可长至10英寸。这种鱼以无脊椎动物为食,如软体动物、蠕虫。它们也吃海草等植物。