Python科学计算最佳实践:SciPy指南
胡安·努内兹-伊格莱西亚斯, 斯特凡·范德瓦尔特, 哈丽雅特·达士诺
陈光欣 译
出版时间:2018年11月
页数:206
本书结合数据实例,使用SciPy及NumPy、pandas、scikit-image等相关库,介绍了强大的Python科学计算工具,展示了如何使用Python编程来处理数据科学研究中可能遇到的现实问题,以及如何写出清晰优美的代码。
本书“麻雀虽小,肝胆俱全”,不仅探讨了作为计算工具本身的SciPy及其相关的库,还阐释了数据科学研究中一些必要的基础概念,是使用Python编程的数据科学研究人员阅读参考的理想选择。
● 探索Python科学应用的基础——NumPy
● 用NumPy和SciPy进行分位数标准化
● 图像区域网络及区域邻接图
● 频率与快速傅里叶变换
● 用稀疏坐标矩阵实现列联表
● SciPy中的线性代数
● SciPy中的函数优化
● 用Toolz在笔记本电脑上玩转大数据
  1. 前言 
  2. 第1章 优雅的NumPy:Python科学应用的基础  
  3. 1.1 数据简介:什么是基因表达  
  4. 1.2 NumPy的N维数组  
  5. 1.3 探索基因表达数据集  
  6. 1.4 标准化  
  7. 1.5 小结  
  8. 第2章 用NumPy和SciPy进行分位数标准化  
  9. 2.1 获取数据  
  10. 2.2 独立样本间的基因表达分布差异
  11. 2.3 计数数据的双向聚类  
  12. 2.4 簇的可视化  
  13. 2.5 预测幸存者  
  14. 第3章 用ndimage实现图像区域网络  
  15. 3.1 图像就是NumPy数组  
  16. 3.2 信号处理中的滤波器  
  17. 3.3 图像滤波(二维滤波器)  
  18. 3.4 通用滤波器:邻近值的任意函数  
  19. 3.5 图与NetworkX库
  20. 3.6 区域邻接图  
  21. 3.7 优雅的ndimage:如何根据图像区域建立图对象  
  22. 3.8 归纳总结:平均颜色分割  
  23. 第4章 频率与快速傅里叶变换  
  24. 4.1 频率的引入  
  25. 4.2 示例:鸟鸣声谱图  
  26. 4.3 历史  
  27. 4.4 实现  
  28. 4.5 选择离散傅里叶变换的长度  
  29. 4.6 更多离散傅里叶变换概念  
  30. 4.7 实际应用:分析雷达数据  
  31. 第5章 用稀疏坐标矩阵实现列联表  
  32. 5.1 列联表  
  33. 5.2 scipy.sparse数据格式  
  34. 5.3 稀疏矩阵应用:图像转换  
  35. 5.4 回到列联表  
  36. 5.5 图像分割中的列联表  
  37. 5.6 信息论简介  
  38. 5.7 图像分割中的信息论:信息变异  
  39. 5.8 转换NumPy数组代码以使用稀疏矩阵
  40. 5.9 使用信息变异  
  41. 第6章 SciPy中的线性代数  
  42. 6.1 线性代数基础  
  43. 6.2 图的拉普拉斯矩阵  
  44. 6.3 大脑数据的拉普拉斯矩阵  
  45. 6.4 PageRank:用于声望和重要性的线性代数  
  46. 6.5 结束语  
  47. 第7章 SciPy中的函数优化  
  48. 7.1 SciPy优化模块:sicpy.optimize  
  49. 7.2 用optimize进行图像配准  
  50. 7.3 用basin hopping算法避开局部最小值
  51. 7.4 选择正确的目标函数  
  52. 第8章 用Toolz在笔记本电脑上玩转大数据  
  53. 8.1 用yield进行流处理  
  54. 8.2 引入Toolz流库  
  55. 8.3 k-mer计数与错误修正  
  56. 8.4 柯里化:流的调料  
  57. 8.5 回到k-mer计数  
  58. 8.6 全基因组的马尔可夫模型  
  59. 后记  
  60. 附录 练习答案  
书名:Python科学计算最佳实践:SciPy指南
译者:陈光欣 译
国内出版社:人民邮电出版社
出版时间:2018年11月
页数:206
书号:978-7-115-49912-7
原版书书名:Elegant SciPy
原版书出版商:O'Reilly Media
胡安·努内兹-伊格莱西亚斯
 
胡安·努内兹-伊格莱西亚斯(Juan Nunez-Iglesias)是澳大利亚莫纳什大学的研究员,同时也是一名自由咨询顾问。此前,他在霍华德·修斯医学院的 Janelia Farm 研究所担任助理研究员(同 Mitya Chklovskii 一起工作),博士毕业于南加利福尼亚大学(专业为计算生物学,导师是 Xianghong Jasmine Zhou),并在该学校担任过研究助理。他的主要研究兴趣是神经科学和图像分析,并对生物信息学和生物统计学中的图形方法具有浓厚的兴趣。
 
 
斯特凡·范德瓦尔特
 
斯特凡·范德瓦尔特(Stéfan van der Walt)是加州大学伯克利分校数据科学研究所的一名助理研究员,同时也是南非斯泰伦博斯大学的应用数学高级讲师。他致力于开源科学软件开发长达十余年之久,并乐于在一些会议和研习班中讲授Python。斯特凡是scikit-image的创建者,同时也是NumPy、SciPy和cesium-ml的贡献者。
 
 
哈丽雅特·达士诺
 
哈丽雅特·达士诺(Harriet Dashnow)是一名生物信息学家,曾在默多克儿童研究所、墨尔本大学生物化学系和维多利亚州生命科学计划项目中工作过。哈丽雅特在墨尔本大学获得了心理学学士、遗传学和生物化学学士以及生物信息学硕士3个学位,目前正在攻读博士学位。她在基因组学、Software Carpentry、Python、R、Unix和Git版本控制等领域组织了一系列研讨会,并在其中讲授计算技能。
 
 
本书封面上的动物是一只乐园维达鸟(学名Vidua paradisaea),又称长尾维达鸟。这种体型小巧、类似麻雀的鸟类分布在东非,从南苏丹到安哥拉南部的地区。
乐园维达鸟的雄性和雌性通常难以分辨,直到繁殖季雄性长出繁殖羽才能看出来。繁殖期的雄性头部呈黑色,胸部呈褐色,后颈羽毛为亮黄色,腹部为白色。黑色尾羽长且宽,长度约为身体的3倍。
乐园维达鸟是绿翅斑腹雀的巢寄生者。雄鸟可以模拟雄性斑腹雀的叫声,因为它们的叫声更响亮,所以绿翅斑腹雀的养父母会给予它们更多关注。这种巢寄生本性使得它们很难被人工饲养,但在美国和其他一些国家中,雄鸟经常被当成宠物贩卖。长尾维达鸟被评定为无危物种。
O'Reilly图书封面上的很多动物都是濒危物种,它们是这个世界的至宝。如果你想为保护动物贡献一份力量,请访问animals.oreilly.com。
封面图片来自Wood's Illustrated Natural History。