關於redhat 5.2 rhcs做HA的問題~~~
請問用redhat 5.2自帶的rhcs做HA:
以下是不是都要發生切換:
重啟和關掉 (active) 那台伺服器
拔掉 (active)伺服器的網線
拔掉(active)伺服器的 fence設備的網線
完全斷電(active)伺服器的 (意思把active服務電源拔了)
請問以上情況是怎麼切換的?
我在做HA的時候遇到以下問題:
1.在分配了優先順序以後 <failoverdomainnode name="ehrdb1" priority="1"/>
<failoverdomainnode name="ehrdb2" priority="2"/>,我重啟active主機。
重啟過程中,oracle服務切換到了備機,主機重啟完成後,oracle服務切回了active主機。
2.但拔掉active主機的網線,兩台機子都要重啟,
3.完全斷電(active)伺服器的 和 拔掉eth0 網線 不做任何切換
如果我把優先順序以後 <failoverdomainnode name="ehrdb1" priority="1"/>
<failoverdomainnode name="ehrdb2" priority="1"/>
都設為1的話:
1.我重啟active,它會切換到standby那台機了,重啟完以後,不會切會來
2.我拔掉active主機(A),它也會切找到standby那台主機(B),
現在standby(B)那台就變成主的了吧,我把原來A的網線接好
在拔B的網線,它不做切換
3.拔掉eth0(fence)網線也不做切換,完全斷電active主機,也不切換
以下是我的配置,請幫忙看看有沒有問題?
請幫忙解釋下ordered="1" restricted="0 以及votes的意思及作用?
配置:
朋友給我說IBM的BMC是邦定在eth0上的,那麼eth0就是在邦定fence設備的
網線都是接在同一交換機上的
資料庫A:主機名:ehrdb1
bios里設置: BMC:192.168.133.70
eth0:192.168.133.60
eth1:10.0.133.60(對外服務)
資料庫B:主機名:ehrdb2
bios里設置: BMC:192.168.133.71
eth0:192.168.133.61
eth1:10.0.133.61(對外服務)
虛擬IP: 10.0.133.69
/etc/hosts里都有主機記錄,這裡就不貼了
版本是redhat 5.0 updata 2 ,安裝的rhcs包有:cman, rgmanager,openipmitools
<?xml version="1.0"?>
<cluster alias="ehrdb" config_version="53" name="ehrdb">
<fence_daemon post_fail_delay="0" post_join_delay="3"/>
<clusternodes>
<clusternode name="ehrdb1" nodeid="1" votes="1">
<fence>
<method name="1">
<device name="bmcdb1"/>
</method>
</fence>
</clusternode>
<clusternode name="ehrdb2" nodeid="2" votes="1">
<fence>
<method name="1">
<device lanplus="" name="bmcdb2"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman expected_votes="1" two_node="1"/>
<fencedevices>
<fencedevice agent="fence_ipmilan" ipaddr="192.168.133.70" login="admin" name="bmcdb1" passwd="123"/>
<fencedevice agent="fence_ipmilan" ipaddr="192.168.133.71" login="admin" name="bmcdb2" passwd="123"/>
</fencedevices>
<rm>
<failoverdomains>
<failoverdomain name="ehrfd" ordered="1" restricted="0">
<failoverdomainnode name="ehrdb1" priority="1"/>
<failoverdomainnode name="ehrdb2" priority="2"/>
</failoverdomain>
</failoverdomains>
<resources>
<fs device="/dev/sdb5" force_fsck="0" force_unmount="1" fsid="60706" fstype="ext3" mountpoint="/db/sys" name="sys" options="" self_fence="0"/>
<fs device="/dev/sdb6" force_fsck="0" force_unmount="1" fsid="62307" fstype="ext3" mountpoint="/db/data" name="data" options="" self_fence="0"/>
<fs device="/dev/sdb7" force_fsck="0" force_unmount="1" fsid="2367" fstype="ext3" mountpoint="/app/sys" name="appsys" options="" self_fence="0"/>
<fs device="/dev/sdb8" force_fsck="0" force_unmount="1" fsid="41738" fstype="ext3" mountpoint="/db/bk" name="bk" options="" self_fence="0"/>
<ip address="10.0.133.69" monitor_link="1"/>
<script file="/home/oracle/bin/oracledb.sh" name="ehr10g"/>
</resources>
<service autostart="1" domain="ehrfd" name="ehrservice">
<fs ref="sys"/>
<fs ref="data"/>
<fs ref="appsys"/>
<fs ref="bk"/>
<ip ref="10.0.133.69"/>
<script ref="ehr10g"/>
</service>
</rm>
</cluster>
[ 本帖最後由 openpower710 於 2008-8-21 23:07 編輯 ]
《解決方案》
拔掉(active)伺服器的 fence設備的網線
完全斷電(active)伺服器的 (意思把active服務電源拔了)
這兩條是不會發生切換的,首先你的fence設備是內部fence,而服務切換是需要fence設備返回信息的。你拔掉fence的網線和拔掉電源,備機都不會接收到fence返回的信息,所以不會切換。只有換成外部的fence,以上兩種測試才能成功。
《解決方案》
回復 #2 yfort 的帖子
照這樣說,用IBM X3850 M2 rhcs做雙機,沒多大意義啊
網線斷了不切換,完全斷電也不切換?
只有系統壞了雜切換?
《解決方案》
業務口斷了會切換的。就是你的10網段斷了會切換的