18.1 Ganglia介绍
Ganglia项目是由加州大学发起的,为了支持依赖计算机进行数据分析的科学研究,Ganglia网站首页这样描述的该项目:“努力创建无处不在的、连续不断的、国家级计算基础架构:网格”。但目前我们只关心Ganglia监视和显示关于集群的信息。
注意:与术语集群类似,术语网格用于描述大量的计算系统,它来自科学研究团体,通常被用于描述多个独立管理的地理上分散的计算集群,使用这个定义,一个网格可以包括一个集群,但一个集群不能包括一个网格,对于网格和集群而言,它们都是并行计算环境。
Ganlgia数据包由多个命令行工具,我们稍后就会看到,以及运行在集群节点上的守护进程组成,在讲述在集群上安装Ganglia之前,让我们先来看两个Ganglia守护进程。
gmond
gmond是Ganglia监视守护进程,gmond的工作是收集它运行的机器的性能量度,并跟踪运行在其他集群节点上的gmond守护进程的状态,如果发现某个gmond守护进程死掉(例如:由于集群节点失效),所有运行的gmond守护进程都会发现。
gstat实用程序可以以XML格式报告gmond收集的信息,从2.7.0版本开始,在传送之前,gmond可以压缩这个XML文件。
gmetad
gmond守护进程在每个集群节点上都是需要的,但gmetad守护进程只需要运行在集群节点管理器上[1],gmetad守护进程每15秒轮询一次gmond守护进程的性能量度,然后使用RRDtool将这些信息存储在一个循环复用的数据库中(在循环复用数据库中,最新的数据覆盖最旧的数据,因此数据库永远都不会被填满)。
gmetad使用Apache服务器显示它收集到的信息,它通过Ganglia Web程序显示Web页面(以前叫做Ganglia Web前端),我们稍后就会讨论Ganglia Web。
[1]参考集群节点管理器的描述。
| 回书目 上一节 下一节 |