請教RHEL5.1 Cluster CMan fencing timeout 的問題
1. 在配置RHEL5.1 的雙節點cluster時,因為qdisk的timetout需要被改得比較長,所以根據Redhat官方文檔需要修改cman 的timeout。從網上查到的修改方法是<cman deadnode_timeout="200" expected_nodes="3"/>.相應地設了deadnode_timeout后仍然沒有效果。一旦出現腦分裂,立刻互相fencing,沒有來得及進行qdisk競選。請問大蝦,有什麼有效的修改cman的timeout的方式嗎?
2.當前的環境還存在另一個問題:在不配qdisk時,如果主節點的FC連接都丟掉了之後,有時能成功切換到副節點,但多數時候都報「kernel: GFS: fsid=cluster:gfsa.0: telling LM to withdraw」,沒有進一步得切換反應。不知道是不是當前版本的GFS的問題,還是配置的問題。大家有碰到過類似問題嗎?
《解決方案》
1、改為如下再試一下。
<cman expected_votes="3" />
<totem token="200000"/>
《解決方案》
俺覺得,還是先把你cluster的結構拿出來看看吧。
《解決方案》
qdisk可以比較好的解決腦分裂的情況。。。:lol:
http://www.redhatmagazine.com/2007/12/19/enhancing-cluster-quorum-with-qdisk/
《解決方案》
謝謝hmqq的解決方案。很有效,成功地解決了我的第一個問題。
對於問題2,沒有設qdisk時的cluster配置如下:
<?xml version="1.0"?>
<cluster alias="cluster" config_version="9" name="cluster">
<fence_daemon post_fail_delay="0" post_join_delay="3"/>
<clusternodes>
<clusternode name="node_one" nodeid="1" votes="1">
<fence>
<method name="1">
<device name="fence" nodename="node_one"/>
</method>
</fence>
</clusternode>
<clusternode name="node_two" nodeid="2" votes="1">
<fence>
<method name="1">
<device name="fence" nodename="node_two"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman expected_votes="1" two_node="1"/>
<fencedevices>
<fencedevice agent="fence_manual" name="fence"/>
</fencedevices>
<rm>
<failoverdomains>
<failoverdomain name="domain" ordered="1" restricted="1">
<failoverdomainnode name="node_one" priority="1"/>
<failoverdomainnode name="node_two" priority="1"/>
</failoverdomain>
</failoverdomains>
<resources>
<clusterfs device="/dev/mapper/mpath1" force_unmount="0" fsid="56527" fstype="gfs" mountpoint="/mnt/a" name="gfsa" options=""/>
<clusterfs device="/dev/mapper/mpath2" force_unmount="0" fsid="36213" fstype="gfs" mountpoint="/mnt/b" name="gfsb" options=""/>
<nfsexport name="export"/>
<nfsclient name="client1" options="no_root_squash,rw,sync" path="/mnt/a" target="*"/>
<ip address="9.11.1.6" monitor_link="1"/>
<nfsclient name="client2" options="no_root_squash,rw,sync" path="/mnt/b" target="*"/>
</resources>
<service autostart="1" domain="domain" name="service1">
<ip ref="9.11.1.6"/>
<clusterfs ref="gfsa">
<nfsexport ref="export">
<nfsclient ref="client1"/>
</nfsexport>
</clusterfs>
<clusterfs ref="gfsb">
<nfsexport ref="export">
<nfsclient ref="client2"/>
</nfsexport>
</clusterfs>
</service>
</rm>
</cluster>