歡迎您光臨本站 註冊首頁

請教RHEL5.1 Cluster CMan fencing timeout 的問題

←手機掃碼閱讀     火星人 @ 2014-03-04 , reply:0

請教RHEL5.1 Cluster CMan fencing timeout 的問題

1. 在配置RHEL5.1 的雙節點cluster時,因為qdisk的timetout需要被改得比較長,所以根據Redhat官方文檔需要修改cman 的timeout。從網上查到的修改方法是<cman deadnode_timeout="200"  expected_nodes="3"/>.相應地設了deadnode_timeout后仍然沒有效果。一旦出現腦分裂,立刻互相fencing,沒有來得及進行qdisk競選。請問大蝦,有什麼有效的修改cman的timeout的方式嗎?
2.當前的環境還存在另一個問題:在不配qdisk時,如果主節點的FC連接都丟掉了之後,有時能成功切換到副節點,但多數時候都報「kernel: GFS: fsid=cluster:gfsa.0: telling LM to withdraw」,沒有進一步得切換反應。不知道是不是當前版本的GFS的問題,還是配置的問題。大家有碰到過類似問題嗎?
《解決方案》

1、改為如下再試一下。
<cman expected_votes="3" />
<totem token="200000"/>
《解決方案》

俺覺得,還是先把你cluster的結構拿出來看看吧。
《解決方案》

qdisk可以比較好的解決腦分裂的情況。。。:lol:
http://www.redhatmagazine.com/2007/12/19/enhancing-cluster-quorum-with-qdisk/
《解決方案》

謝謝hmqq的解決方案。很有效,成功地解決了我的第一個問題。
對於問題2,沒有設qdisk時的cluster配置如下:
<?xml version="1.0"?>
<cluster alias="cluster" config_version="9" name="cluster">
        <fence_daemon post_fail_delay="0" post_join_delay="3"/>
        <clusternodes>
                <clusternode name="node_one" nodeid="1" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="fence" nodename="node_one"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="node_two" nodeid="2" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="fence" nodename="node_two"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <cman expected_votes="1" two_node="1"/>
        <fencedevices>
                <fencedevice agent="fence_manual" name="fence"/>
        </fencedevices>
        <rm>
                <failoverdomains>
                        <failoverdomain name="domain" ordered="1" restricted="1">
                                <failoverdomainnode name="node_one" priority="1"/>
                                <failoverdomainnode name="node_two" priority="1"/>
                        </failoverdomain>
                </failoverdomains>
                <resources>
                        <clusterfs device="/dev/mapper/mpath1" force_unmount="0" fsid="56527" fstype="gfs" mountpoint="/mnt/a" name="gfsa" options=""/>
                        <clusterfs device="/dev/mapper/mpath2" force_unmount="0" fsid="36213" fstype="gfs" mountpoint="/mnt/b" name="gfsb" options=""/>
                        <nfsexport name="export"/>
                        <nfsclient name="client1" options="no_root_squash,rw,sync" path="/mnt/a" target="*"/>
                        <ip address="9.11.1.6" monitor_link="1"/>
                        <nfsclient name="client2" options="no_root_squash,rw,sync" path="/mnt/b" target="*"/>
                </resources>
                <service autostart="1" domain="domain" name="service1">
                        <ip ref="9.11.1.6"/>
                        <clusterfs ref="gfsa">
                                <nfsexport ref="export">
                                        <nfsclient ref="client1"/>
                                </nfsexport>
                        </clusterfs>
                        <clusterfs ref="gfsb">
                                <nfsexport ref="export">
                                        <nfsclient ref="client2"/>
                                </nfsexport>
                        </clusterfs>
                </service>
        </rm>
</cluster>

[火星人 ] 請教RHEL5.1 Cluster CMan fencing timeout 的問題已經有792次圍觀

http://coctec.com/docs/service/show-post-7675.html