9.3 网络故障
即使做了这些准备,我们仍然不能在双服务器Heartbeat故障转移设计中排除所有的单点故障,例如:如果主服务器只是不能在普通的或生产网络上与客户端计算机进行通讯将会发生什么?
在那种情况下,如果你正确地配置了Heartbeat,心跳消息将继续传播到备用服务器,这得归功于你建立的Heartbeat路径冗余(在第8章中有描述),将不会发生故障转移,客户端计算机仍然不能够访问主服务器上的资源守护进程(集群资源)。
我们至少有两种办法来解决这个问题:
在主服务器上运行一个扩展的监视软件包,如Perl程序Mon,观察公共网卡的故障,当Mon检测到该网卡失效了,它将关闭主服务器上的Heartbeat守护进程(或强制它进入备用状态),然后备用服务器会接管资源,假设它是健康的,可以在它的公共网卡上进行通讯,客户端计算机将再次访问到资源。(参考第17章了解关于Mon的更多信息)
使用ipfail API插件,它允许你在Heartbeat配置文件中指定一个或多个ping服务器,如果主服务器突然看到其中一个ping服务器失效,它询问备用服务器:“你也看到那个ping服务器关闭了吗?”,如果备用服务器仍然可以与ping服务器对话,它就明白原来是主服务器不能在网络上进行正常通讯了,现在它就应该取得资源的所有权。
ipfail
从Heartbeat 0.4.9d版本开始,ipfail插件就作为Heartbeat发行的一个标准部分包括在Heartbeat RPM包中了,要使用ipfail,首先要决定两台服务器使用哪块网卡(ip地址)能在任何时候ping通(如永远不会关闭的共享路由器,网络交换机等),接下来,将这个ip地址输入到你的/etc/ha.d/ha.cf文件中,并告诉Heartbeat每当它启动时就启动ipfail插件:
#vi /etc/ha.d/ha.cf |
在文件末尾最后一个server行前添加下面三行:
respawn hacluster /usr/lib/heartbeat/ipfail |
上面的第一行告诉Heartbeat在主服务器和备用服务器上启动ipfail程序[6],如果它停止了就重新启动,使用在安装Heartbeat RPM包过程中创建的hacluster用户;第二行指出一个或多个ping服务器或网络节点,Heartbeat应该在心跳间隔期间ping通,确保它的网络连接是可以正常工作的。(如果你正在建立一个防火墙机器,例如:你可能想在两个接口或网络上都使用ping服务器[7])
注意:如果你使用的是1.1.2之前的Heartbeat版本,你必须开启nice_failback选项,1.1.2及以后的版本允许auto_failback选项(替换nice_failback选项,但意思相反)开启或关闭。
现在启动主/备服务器上的Heartbeat测试你的配置,你应该查看/var/log/messages文件中的象征Heartbeat启动ipfail子进程的消息,尝试拔出主服务器的网线,这样它就不能ping通ping服务器了,观察ipfail强制将主服务器置于备用模式,备用服务器就应该接管haresources列出的资源了。
[6]主/备服务器上的/etc/ha.d/ha.cf配置文件应该是一样的。
[7]当然,一定要配置iptables或ipchains规则接受ICMP通讯(参考第2章)。
| 回书目 上一节 下一节 |
|
||||
| · 微软出价446亿美元收购.. · 虚拟化的“赤壁之战” · Windows Server 2008专.. · 无线重中之重:安全问题 · 802.11n:下一代的无线.. · 脉冲无线电uwb专题 · AIX操作系统管理应用 · 云计算时代来临 |
· 求职必杀技 决战面试官 · 龙芯要做中国的“奔腾” · 2008年上半年IT技术图.. · 服务器节能与绿色IT · IT工程师该不该考CCIE.. · 浏览器的战国时代 · 2008年上半年全国软考.. · 无线网络环境 |
|||
|
||||
| · SOA 面向服务架构 · SQL Server 2008/2005.. · Apache技术专题 · 三层交换技术专题 · SQL Server入门到精通 · 无线网状网(MESH) · Windows远程桌面应用 · C#技术开发指南 |
· Apache技术专题 · Windows集群服务应用 · C#技术开发指南 · 文档格式标准开战 OOXM.. · 路由器设置与口令恢复 · Linux 集群技术专题 · PHP开发应用手册 · SOA 面向服务架构 |
|||
|
||||
| · SQL Server入门到精通 · SQL Server 2008/2005.. · SOA 面向服务架构 · Apache技术专题 · C#技术开发指南 · 三层交换技术专题 · Apache技术专题 · C#技术开发指南 |
· Windows远程桌面应用 · 企业数据恢复指南 · Windows集群服务应用 · 路由器设置与口令恢复 · Linux 集群技术专题 · SOA 面向服务架构 · 了解统一威胁管理(UTM).. · 解析35岁技术人的价值.. |
|||