SOS,緊急求助 關於Was 的 Cluster
有兩台IBM 3650X M3的機器,安裝了RHEL5.5,在上面部署了高可用軟體redhat cluster suit。
---------------------------------------------------------------------------
機器 eth0 管理埠(fance設備)
frt1 10.12.5.33 10.12.5.140
frt2 10.12.5.34 10.12.5.141
對外提供服務的地址為:10.12.5.35
---------------------------------------------------------------------------
在上面部署了WebSphere.服務的啟動、狀態都正常。(Was之間相互獨立。概要文件類型都是appserver 。)
也可以通過10.12.5.35來訪問websphere的服務。
但是問題是,我把當前提供服務的節點上的Websphere停止了,不能切換到另外的節點(等待很長時間都不行)。
clusvcadm -r haser -m frt2 可以切換到第二個節點上。
集群配置文件如下:
------------------------------------------------------------------------------------------------------------------------------------------------------
<?xml version="1.0"?>
<cluster alias="ecdsfront" config_version="18" name="front">
<fence_daemon post_fail_delay="0" post_join_delay="30"/>
<clusternodes>
<clusternode name="frt1" nodeid="1" votes="1">
<fence>
<method name="1">
<device lanplus="" name="frt1fen"/>
</method>
</fence>
</clusternode>
<clusternode name="frt2" nodeid="2" votes="1">
<fence>
<method name="1">
<device lanplus="" name="frt2fen"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman expected_votes="1" two_node="1"/>
<fencedevices>
<fencedevice agent="fence_ipmilan" auth="password" ipaddr="10.12.5.140" login="USERID" name="frt1fen" passwd="PASSW0RD"/>
<fencedevice agent="fence_ipmilan" auth="password" ipaddr="10.12.5.141" login="USERID" name="frt2fen" passwd="PASSW0RD"/>
</fencedevices>
<rm>
<failoverdomains>
<failoverdomain name="ha_domain" ordered="0" restricted="1">
<failoverdomainnode name="frt1" priority="1"/>
<failoverdomainnode name="frt2" priority="1"/>
</failoverdomain>
</failoverdomains>
<resources>
<ip address="10.12.5.35" monitor_link="1"/>
<script file="/etc/init.d/wasserver" name="was"/>
</resources>
<service autostart="1" domain="ha_domain" name="haser" recovery="relocate">
<ip ref="10.12.5.35"/>
<script ref="was"/>
</service>
</rm>
</cluster>
------------------------------------------------------------------------------------------------------------------------------------------------------
wasserver的內容如下:
#!/bin/bash
. /etc/init.d/functions
# Source function library.
PATH=/usr/bin:/bin:/opt/IBM/WebSphere/AppServer/profiles/default01/bin
WASID=`ps -ef|grep java|grep server1|grep -v grep|cut -c 10-15`
WASSERVERS="server1"
#==============================================================================
SU="sh"
#==============================================================================
start() {
for wasserver in $WASSERVERS ; do
export wasserver
echo "$0: starting websphere application server $wasserver"
$SU -c "startServer.sh $wasserver"
done
}
#==============================================================================
stop() {
for wasserver in $WASSERVERS ; do
export wasserver
echo "$0: stopping websphere application server $wasserver"
$SU -c "stopServer.sh $wasserver"
#sleep 30
done
}
status() {
if [ $WASID -gt 0 ]; then
RETVAL=0
else
RETVAL=3
fi
}
case $1 in
'start')
start
;;
'stop')
stop
;;
'restart')
stop
start
;;
'status')
status
;;
*)
echo "usage: $0 {start|stop|restart|status}"
;;
esac
《解決方案》
/etc/hosts配置的對嗎
《解決方案》
hosts文件內容。
10.12.5.33 frt1
10.12.5.34 frt2
10.12.5.140 frt1fen
10.12.5.141 frt2fen
10.12.5.35 haser
127.0.0.1和::1這行已被註釋了。
《解決方案》
希望摟主解決了問題能那出來分享一下:neutral:
《解決方案》
上面的問題解決了。原因是由於WAS的腳本不對。等全部搞好了會發布一個文檔。
現在MQ的腳本還有點問題。不知道哪位大俠坐過MQ的HA,提供一下MQ的腳本。謝謝了。
《解決方案》
我估計,是切換MQ之後有一個節點老提示內部錯誤。
《解決方案》
不要註釋127.0.0.1,這可能會導致很多問題和麻煩。
《解決方案》
如果我不註釋127.0.0.1這行。啟動cman時會報錯。