歡迎您光臨本站 註冊首頁

關於redhat 5.2 rhcs做HA的問題~~~

←手機掃碼閱讀     火星人 @ 2014-03-04 , reply:0

關於redhat 5.2 rhcs做HA的問題~~~

請問用redhat 5.2自帶的rhcs做HA:
以下是不是都要發生切換:
重啟和關掉 (active) 那台伺服器
拔掉 (active)伺服器的網線
拔掉(active)伺服器的 fence設備的網線
完全斷電(active)伺服器的 (意思把active服務電源拔了)


請問以上情況是怎麼切換的?

我在做HA的時候遇到以下問題:

1.在分配了優先順序以後 <failoverdomainnode name="ehrdb1" priority="1"/>
                   <failoverdomainnode name="ehrdb2" priority="2"/>,我重啟active主機。
重啟過程中,oracle服務切換到了備機,主機重啟完成後,oracle服務切回了active主機。

2.但拔掉active主機的網線,兩台機子都要重啟,

3.完全斷電(active)伺服器的 和 拔掉eth0 網線 不做任何切換

如果我把優先順序以後 <failoverdomainnode name="ehrdb1" priority="1"/>
                   <failoverdomainnode name="ehrdb2" priority="1"/>
都設為1的話:
1.我重啟active,它會切換到standby那台機了,重啟完以後,不會切會來
2.我拔掉active主機(A),它也會切找到standby那台主機(B),
現在standby(B)那台就變成主的了吧,我把原來A的網線接好
在拔B的網線,它不做切換
3.拔掉eth0(fence)網線也不做切換,完全斷電active主機,也不切換

以下是我的配置,請幫忙看看有沒有問題?

請幫忙解釋下ordered="1" restricted="0 以及votes的意思及作用?

配置:

   朋友給我說IBM的BMC是邦定在eth0上的,那麼eth0就是在邦定fence設備的

網線都是接在同一交換機上的
   
資料庫A:主機名:ehrdb1
bios里設置: BMC:192.168.133.70
            eth0:192.168.133.60
            
             eth1:10.0.133.60(對外服務)
            
   資料庫B:主機名:ehrdb2
bios里設置: BMC:192.168.133.71
            eth0:192.168.133.61
            
             eth1:10.0.133.61(對外服務)

   虛擬IP: 10.0.133.69


/etc/hosts里都有主機記錄,這裡就不貼了
版本是redhat 5.0 updata 2 ,安裝的rhcs包有:cman, rgmanager,openipmitools




<?xml version="1.0"?>
<cluster alias="ehrdb" config_version="53" name="ehrdb">
        <fence_daemon post_fail_delay="0" post_join_delay="3"/>
        <clusternodes>
                <clusternode name="ehrdb1" nodeid="1" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="bmcdb1"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="ehrdb2" nodeid="2" votes="1">
                        <fence>
                                <method name="1">
                                        <device lanplus="" name="bmcdb2"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <cman expected_votes="1" two_node="1"/>
        <fencedevices>
                <fencedevice agent="fence_ipmilan" ipaddr="192.168.133.70" login="admin" name="bmcdb1" passwd="123"/>
                <fencedevice agent="fence_ipmilan" ipaddr="192.168.133.71" login="admin" name="bmcdb2" passwd="123"/>
        </fencedevices>
        <rm>
                <failoverdomains>
                        <failoverdomain name="ehrfd" ordered="1" restricted="0">
                                <failoverdomainnode name="ehrdb1" priority="1"/>
                                <failoverdomainnode name="ehrdb2" priority="2"/>
                        </failoverdomain>
                </failoverdomains>
                <resources>
                        <fs device="/dev/sdb5" force_fsck="0" force_unmount="1" fsid="60706" fstype="ext3" mountpoint="/db/sys" name="sys" options="" self_fence="0"/>
                        <fs device="/dev/sdb6" force_fsck="0" force_unmount="1" fsid="62307" fstype="ext3" mountpoint="/db/data" name="data" options="" self_fence="0"/>
                        <fs device="/dev/sdb7" force_fsck="0" force_unmount="1" fsid="2367" fstype="ext3" mountpoint="/app/sys" name="appsys" options="" self_fence="0"/>
                        <fs device="/dev/sdb8" force_fsck="0" force_unmount="1" fsid="41738" fstype="ext3" mountpoint="/db/bk" name="bk" options="" self_fence="0"/>
                        <ip address="10.0.133.69" monitor_link="1"/>
                        <script file="/home/oracle/bin/oracledb.sh" name="ehr10g"/>
                </resources>
                <service autostart="1" domain="ehrfd" name="ehrservice">
                        <fs ref="sys"/>
                        <fs ref="data"/>
                        <fs ref="appsys"/>
                        <fs ref="bk"/>
                        <ip ref="10.0.133.69"/>
                        <script ref="ehr10g"/>
                </service>
        </rm>
</cluster>

[ 本帖最後由 openpower710 於 2008-8-21 23:07 編輯 ]
《解決方案》

拔掉(active)伺服器的 fence設備的網線
完全斷電(active)伺服器的 (意思把active服務電源拔了)
這兩條是不會發生切換的,首先你的fence設備是內部fence,而服務切換是需要fence設備返回信息的。你拔掉fence的網線和拔掉電源,備機都不會接收到fence返回的信息,所以不會切換。只有換成外部的fence,以上兩種測試才能成功。
《解決方案》

回復 #2 yfort 的帖子

照這樣說,用IBM X3850 M2 rhcs做雙機,沒多大意義啊
網線斷了不切換,完全斷電也不切換?

只有系統壞了雜切換?
《解決方案》

業務口斷了會切換的。就是你的10網段斷了會切換的

[火星人 ] 關於redhat 5.2 rhcs做HA的問題~~~已經有693次圍觀

http://coctec.com/docs/service/show-post-7159.html