Ganglia系统监控
Matt Massie, Bernard Li, Brad Nicholes, Vladimir Vuksan
陈学鑫, 张诚诚 译
出版时间:2013年08月
页数:214
本书由Ganglia的设计者和维护人员亲自执笔,知识性和权威性毋庸置疑。本书不但展示了如何从任意规模的集群、网格或云基础架构中收集系统指标并使其可视化,而且为如何针对20000台主机每10秒跟踪一次CPU利用率等问题提供答案。一旦你知晓Ganglia的主要部件如何协同工作,就会明白Ganglia是解决上述问题的最佳选择。本书颇具实践性,可以帮助经验丰富的系统管理员更好地运用Ganglia 3.X。
本书还可以帮助你了解如何扩展基本的指标库,取回当前指标数值,查看指标的汇聚视图,观察数据时序的趋势。你也可以通过一些实际Ganglia案例了解它是如何满足监控的一些需求的。
· 判断Ganglia是否适合你的工作环境。
· 了解Ganglia的gmond和gmetad后台程序是如何建立一个临时指标集合的。
· 根据一些有价值的提示和建议,在部署Ganglia的早期制订可扩展的计划。
· 利用gweb和Ganglia的Web客户端进一步可视化数据。
· 编写插件来扩展gmond的指标集。
· 如何解决安装Ganglia时可能遇到的问题。
· 如何将Ganglia和sFlow以及Nagios监控系统集成。
Matt Massie:Cloudera软件工程师,在担任加利福尼亚大学伯克利分校研究员时设计开发了Ganglia。
Bernard Li:劳伦斯伯克利国家实验室高性能计算系统工程师,Ganglia系统的维护工程师。
Brad Nicholes:Novell公司软件顾问工程师,Ganglia项目的开发者及系统管理员。
Vladimir Vuksan:Broadcomg公司系统管理员,Ganglia维护
人员。
本书的贡献者还包括:Robert Alexander、Jeff Buchbinder、 Frederiko Costa、Alex Dean、 Dave Josephsen、Peter Phaal和Daniel Pocock。
  1. 前言
  2. 第1章 初识Ganglia
  3. 规模的问题
  4. 主机即监控系统
  5. 基于冗余的结构
  6. Ganglia是否适合你
  7. gmond:字节大爆炸
  8. gmetad:整合所有信息
  9. gweb:下一代数据分析
  10. 稍等!这并不是所有
  11. 第2章 Ganglia的安装和配置
  12. Ganglia的安装
  13. Ganglia的配置
  14. 安装后的工作
  15. 第3章 可扩展性
  16. 谁会关注可扩展性
  17. gmond和Ganglia集群的可扩展性
  18. gmetad存储规划和可扩展性
  19. 第4章 Ganglia的Web界面
  20. Ganglia的Web 界面导航
  21. gweb的Search选项卡
  22. gweb的Views选项卡
  23. gweb 的Aggregated Graphs选项卡
  24. gweb的Compare Hosts选项卡
  25. gweb的Events选项卡
  26. gweb的Automatic Rotation选项卡
  27. gweb的Mobile选项卡
  28. 自定义复合图表
  29. 其他特性
  30. 认证和授权
  31. 第5章 指标管理和扩展
  32. gmond:指标收集代理
  33. 基本指标
  34. 扩展指标
  35. 利用模块扩展gmond
  36. 利用gmetric扩展gmond
  37. 如何在C/C++、Python和gmetric之间做出选择
  38. XDR协议
  39. Java和gmetric4j
  40. 真实世界:利用NVML模块进行GPU监控
  41. 第6章 Ganglia故障排查与处理
  42. 概述
  43. 有用的资源
  44. 对监控系统进行监控
  45. 常用故障排查机制及工具
  46. 在前台/调试模式下运行
  47. 常见的部署问题
  48. 典型问题及解决步骤
  49. 第7章 Ganglia与Nagios
  50. 发送Nagios数据到Ganglia
  51. 使用Nagios监控Ganglia指标
  52. 在Nagios UI中显示Ganglia数据
  53. 使用Nagios监控Ganglia
  54. 第8章 Ganglia与sFlow
  55. 架构
  56. 标准sFlow指标
  57. Java虚拟机指标
  58. 配置gmond以接收sFlow
  59. Host sFlow 代理
  60. 故障解决
  61. 联合其他sFlow工具使用Ganglia
  62. 第9章 Ganglia案例分析
  63. Tagged公司
  64. SARA
  65. 路透社财务软件
  66. Lumicall(Android上的移动VoIP)
  67. 稍等,多少指标?监控Quantcast
  68. 工具箱中的很多工具:监控Etsy
  69. 附录A 先进的指标配置与调试
  70. 附录B Ganglia和Hadoop/HBase
书名:Ganglia系统监控
译者:陈学鑫, 张诚诚 译
国内出版社:机械工业出版社
出版时间:2013年08月
页数:214
书号:978-7-111-43674-4
原版书书名:Monitoring with Ganglia
原版书出版商:O'Reilly Media
Matt Massie
 
Matt Massie,2000年在加利福尼亚大学伯克利分校担任研究员时开发了Ganglia。他设计的Ganglia实现了对遍布整个美国,用于科学研究的共享计算机网格集群的监控。2010年,在O’Reilly出版的由John Allspaw和Jesse Robbins编写的 Web Operations: Keeping the Data On Time(http://shop.oreilly.com/product/0636920000136.do)一书中,他撰写了关于集群监控的一个章节。Matt现在Cloudera担任软件工程师,聚焦于Apache Hadoop企业管理与监控。
 
 
Bernard Li
 
Bernard Li,担任劳伦斯伯克利国家实验室高性能计算系统工程师,目前也是Ganglia系统的维护工程师。他从2003年开始涉及高性能计算领域并致力于很多开源项目,如OSCAR、SystemImager和Warewulf。
 
 
Brad Nicholes
 
Brad Nicholes,是Apache软件基金会的成员,目前在Novell担任软件工程师顾问。除了参与Apache HTTPD和APR项目,Brad也是Ganglia项目的开发者和管理员。作为Ganglia项目的开发人员,Brad开发了C/C++和Python指标模块,并将其集成至Ganglia V3.1.x。目前Ganglia系统提供的部分指标模块,最初是由他开发贡献的。Brad毕业于犹他大学(University of Utah)和杨百翰大学(Brigham Young University),拥有计算机科学
学位。
 
 
Vladimir Vuksan
 
Vladimir Vuksan(Broadcom),在技术操作、系统工程和软件开发领域工作超过15年。就职于Broadcom之前,他曾在Rave Mobile Safety、Demandware和新墨西哥大学(University of New Mexico)开发高可用性解决方案和使管理和基础设施运行更容易的工具。
 
 
本书的封面展示的是一种来自太平洋热带地区的动物,学名Porpita pacifica ,通常叫做海钱或者蓝纽扣(blue button)。它是一个1.5英寸见方的蓝色流苏状的无脊椎动物,它纤细的触角有粘性,沿着它充满气体的体腔向四周伸展,这些纤细的触角很容易被海浪损坏。据说它会对人的皮肤造成刺激性的蜇刺,但是并不严重。
这种蓝纽扣生活在海洋的表面,主要由两部分组成: 浮盘部分和水螅形的躯干部分。它的金褐色的浮盘部分是圆形的,几乎是平的,大约1英寸宽。水螅形的躯干部分,颜色处于蓝绿色到黄色之间,它的触须和水母的很类似,每股触角都有很多分支,在分支的末端是一簇针状细胞,叫做刺细胞。
在食物链中,它的尺寸决定了它很容易被不同的生物捕获,蓝纽扣是一个被动的漂流生物,它的主要食物来源就是它在漂流过程中碰到的生物,它和其他的漂流生物一样,主要以小鱼、鱼籽和其他浮游生物为食,蓝纽扣的口部位于躯干体下部,用作摄入养分和排出代谢物。蓝纽扣通过分裂进行繁殖,从而形成新的群体。