歡迎您光臨本站 註冊首頁

SOS,緊急求助 關於Was 的 Cluster

←手機掃碼閱讀     火星人 @ 2014-03-04 , reply:0

SOS,緊急求助 關於Was 的 Cluster

有兩台IBM 3650X M3的機器,安裝了RHEL5.5,在上面部署了高可用軟體redhat cluster suit。
---------------------------------------------------------------------------
機器         eth0            管理埠(fance設備)
frt1   10.12.5.33      10.12.5.140
frt2   10.12.5.34      10.12.5.141  
對外提供服務的地址為:10.12.5.35
---------------------------------------------------------------------------

在上面部署了WebSphere.服務的啟動、狀態都正常。(Was之間相互獨立。概要文件類型都是appserver 。)
也可以通過10.12.5.35來訪問websphere的服務。
但是問題是,我把當前提供服務的節點上的Websphere停止了,不能切換到另外的節點(等待很長時間都不行)。
clusvcadm  -r haser -m frt2 可以切換到第二個節點上。


集群配置文件如下:
------------------------------------------------------------------------------------------------------------------------------------------------------

<?xml version="1.0"?>
<cluster alias="ecdsfront" config_version="18" name="front">
        <fence_daemon post_fail_delay="0" post_join_delay="30"/>
        <clusternodes>
                <clusternode name="frt1" nodeid="1" votes="1">
                        <fence>
                                <method name="1">
                                        <device lanplus="" name="frt1fen"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="frt2" nodeid="2" votes="1">
                        <fence>
                                <method name="1">
                                        <device lanplus="" name="frt2fen"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <cman expected_votes="1" two_node="1"/>
        <fencedevices>
                <fencedevice agent="fence_ipmilan" auth="password" ipaddr="10.12.5.140" login="USERID" name="frt1fen" passwd="PASSW0RD"/>
                <fencedevice agent="fence_ipmilan" auth="password" ipaddr="10.12.5.141" login="USERID" name="frt2fen" passwd="PASSW0RD"/>
        </fencedevices>
        <rm>
                <failoverdomains>
                        <failoverdomain name="ha_domain" ordered="0" restricted="1">
                                <failoverdomainnode name="frt1" priority="1"/>
                                <failoverdomainnode name="frt2" priority="1"/>
                        </failoverdomain>
                </failoverdomains>
                <resources>
                        <ip address="10.12.5.35" monitor_link="1"/>
                        <script file="/etc/init.d/wasserver" name="was"/>
                </resources>
                <service autostart="1" domain="ha_domain" name="haser" recovery="relocate">
                        <ip ref="10.12.5.35"/>
                        <script ref="was"/>
                </service>
        </rm>
</cluster>
------------------------------------------------------------------------------------------------------------------------------------------------------

wasserver的內容如下:

#!/bin/bash
. /etc/init.d/functions
# Source function library.

PATH=/usr/bin:/bin:/opt/IBM/WebSphere/AppServer/profiles/default01/bin
WASID=`ps -ef|grep java|grep server1|grep -v grep|cut -c 10-15`
WASSERVERS="server1"
#==============================================================================
SU="sh"
#==============================================================================
start() {
    for wasserver in $WASSERVERS ; do
        export wasserver
          echo "$0: starting websphere application server $wasserver"
          $SU -c "startServer.sh $wasserver"
    done
}
#==============================================================================
stop() {
    for wasserver in $WASSERVERS ; do
        export wasserver
        echo "$0: stopping websphere application server $wasserver"
        $SU -c "stopServer.sh $wasserver"
        #sleep 30
    done
}
status() {
        if [ $WASID -gt 0 ]; then
          
          RETVAL=0
        else
         RETVAL=3
        fi
}

case $1 in
'start')
    start
    ;;
'stop')
    stop
    ;;
'restart')
    stop
    start
    ;;
'status')
     status
     ;;
*)
    echo "usage: $0 {start|stop|restart|status}"
    ;;
esac
《解決方案》

/etc/hosts配置的對嗎
《解決方案》

hosts文件內容。
10.12.5.33 frt1
10.12.5.34 frt2
10.12.5.140 frt1fen
10.12.5.141 frt2fen
10.12.5.35 haser

127.0.0.1和::1這行已被註釋了。
《解決方案》

希望摟主解決了問題能那出來分享一下:neutral:
《解決方案》

上面的問題解決了。原因是由於WAS的腳本不對。等全部搞好了會發布一個文檔。
現在MQ的腳本還有點問題。不知道哪位大俠坐過MQ的HA,提供一下MQ的腳本。謝謝了。
《解決方案》

我估計,是切換MQ之後有一個節點老提示內部錯誤。
《解決方案》

不要註釋127.0.0.1,這可能會導致很多問題和麻煩。
《解決方案》

如果我不註釋127.0.0.1這行。啟動cman時會報錯。

[火星人 ] SOS,緊急求助 關於Was 的 Cluster已經有687次圍觀

http://coctec.com/docs/service/show-post-5482.html