歡迎您光臨本站 註冊首頁

rhcs配置的腳本無法啟動,確認是按照init.d中格式寫的,幫忙看看

腳本如下#!/bin/bash
#Cluster service script to start, stop, and check status of App
source /etc/profile
source /root/.bash_profile

case $1 in
start)
        #call start app script
        echo -e "Starting Application:"
        su - weixi -c "bash /weixi/wx_domain/startweixi.sh >> /weixi/wx_domain/startweixi.log 2>&1 &"
        su - yinxiao -c "bash /yinxiao/yx_domain/startyinxiao.sh >> /yinxiao/yx_domain/startyinxiao.log 2>&1 &"
        su - menhu -c "bash /menhu/mh_domain/startmenhu.sh >> /menhu/mh_domain/startmenhu.log 2>&1 &"
        su - zzqs -c "bash /zzqs/zzqs_domain/startzzqs.sh >> /zzqs/zzqs_domain/startzzqs.log 2>&1 &"
        sleep 30
        echo -e "Starting Application successfully!\n"
        exit $?
        ;;

stop)
        #call stop app script
        echo -n "Stopping Application:"
        su - weixi -c "bash /weixi/wx_domain/stopweixi.sh >> /weixi/wx_domain/stopweixi.log 2>&1 &"
        su - yinxiao -c "bash /yinxiao/yx_domain/stopyinxiao.sh >> /yinxiao/yx_domain/stopyinxiao.log 2>&1 &"
        su - menhu -c "bash /menhu/mh_domain/stopmenhu.sh >> /menhu/mh_domain/stopmenhu.log 2>&1 &"
        su - zzqs -c "bash /zzqs/zzqs_domain/stopzzqs.sh >> /zzqs/zzqs_domain/stopzzqs.log 2>&1 &"
        sleep 20;
        echo -e "Stopping Application successfully!\n"
        exit $?
        ;;

restart)
        $0 stop || exit $?
        $0 start || exit $?
        ;;

status)
        #call monitor script
        #/etc/cluster/rhcs/chk_status.sh
        exit $?
        ;;

*)
        echo "usage: $0 {start|stop|status|restart}"
        exit 1
        ;;

esac我使用
clusvcadm -e web_ser_scp -m webproxy1.cluster.com  --來啟動,結果為# clusvcadm -e web_ser_scp -m webproxy1.cluster.com
Member webproxy1.cluster.com trying to enable service:web_ser_scp...Aborted; service failed在log中的報錯信息為
Sep  3 15:37:11 webproxy1 clurgmgrd: <err> #43: Service service:web_ser_scp has failed; can not start.
Sep  3 15:37:11 webproxy1 clurgmgrd: <crit> #13: Service service:web_ser_scp failed to stop cleanly
Sep  3 15:42:09 webproxy1 clurgmgrd: <err> #43: Service service:web_ser_scp has failed; can not start.
Sep  3 15:42:09 webproxy1 clurgmgrd: <crit> #13: Service service:web_ser_scp failed to stop cleanly
Sep  3 15:47:56 webproxy1 clurgmgrd: <err> #43: Service service:web_ser_scp has failed; can not start.
Sep  3 15:47:56 webproxy1 clurgmgrd: <crit> #13: Service service:web_ser_scp failed to stop cleanly
Sep  3 15:48:36 webproxy1 clurgmgrd: <err> #43: Service service:web_ser_scp has failed; can not start.
Sep  3 15:48:36 webproxy1 clurgmgrd: <crit> #13: Service service:web_ser_scp failed to stop cleanly
Sep  3 15:53:27 webproxy1 clurgmgrd: <err> #43: Service service:web_ser_scp has failed; can not start.
Sep  3 15:53:27 webproxy1 clurgmgrd: <crit> #13: Service service:web_ser_scp failed to stop cleanly

集群現在的狀態為
# clustat
Cluster Status for webproxy-ha @ Fri Sep  3 15:59:23 2010
Member Status: Quorate

Member Name                                                     ID   Status
------ ----                                                     ---- ------
webproxy1.cluster.com                                               1 Online, Local, rgmanager
webproxy2.cluster.com                                               2 Online, rgmanager

Service Name                                             Owner (Last)                                             State         
------- ----                                             ----- ------                                             -----         
service:web_ser_ip                                       webproxy1.cluster.com                                    started      
service:web_ser_scp                                      (webproxy1.cluster.com)                                  failed  

幫忙看看,我這個腳本是不是有什麼地方不對,
這個單獨用root是可以使用的,start,stop都很正常。但是放在集群中,就不行
先謝了
《解決方案》

看帖的多,回帖的少
《解決方案》

又是自己解決
rhcs的報錯信息並不准確
當我將腳本清空只有 echo語句是,仍然報錯,所以,問題肯定就不是腳本了。

停掉cman  和 rgmanager后
在講resource和service重新配置,
在啟動cman  和 rgmanager,就ok那!
《解決方案》

處理問題的思路不錯
《解決方案》

本帖最後由 hb_li_520 於 2010-09-07 10:25 編輯

我覺得要想到為什麼會出這樣的問題,而不是這樣一重啟了之。
這樣問題還是會重現的。小心。
特別是正式用的時候,不是允許有這樣的情況存在的。

而且腳本也有問題?
status)

        #call monitor script

        #/etc/cluster/rhcs/chk_status.sh

        exit $?

        ;;

返回的是什麼?RHCS估計不會認識這個東西
《解決方案》

LS,你有仔細看我回帖嘛!
這個是生產環境,可沒有隨隨便便這樣就重啟了之的,這個都是要反覆在有實際應用的情況下測試的。

腳本編寫上沒有問題,問題是保存在cluster.conf文件中的內容在被rgmanger載入的過程中有問題。而集群軟體又不能給出清楚明確的定位。

至於monitor那裡,我完全可以不寫,
《解決方案》

本帖最後由 hb_li_520 於 2010-09-08 10:45 編輯

LS,你有仔細看我回帖嘛!
這個是生產環境,可沒有隨隨便便這樣就重啟了之的,這個都是要反覆在有實際應用 ...
jerryjzm 發表於 2010-09-07 22:26 http://linux.chinaunix.net/bbs/images/common/back.gif


    那請問一下,你有測試過你停掉服務,而不是停掉機器,機器的服務是如何運作的?是切換另外的機器上,還是重啟服務,還是死在那?

   預計沒有測試過這個。因為看到status狀態的返回值,不明確。
  
   exit $? 返回的是什麼? 是"0" 還是"-127".......
《解決方案》

回復 7# hb_li_520


這個我還真測試了,
停服務
拔網線
停機器
我都測試了

除了拔電源,畢竟我使用的內置的fence,以上的也是最基本的測試內容。
《解決方案》

回復  hb_li_520


這個我還真測試了,
停服務
拔網線
停機器
我都測試了

除了拔電源,畢竟我使 ...
jerryjzm 發表於 2010-09-08 11:11 http://linux.chinaunix.net/bbs/images/common/back.gif


   請問停服務后的結果是什麼?是切換,還是重啟服務?
  內部fence用在生產環境~我想我是不敢這麼乾的。
  因為你的exit $?返回值為不確定性。停服務與啟動服務區別不開。
  以上僅供參考,僅代表我個人的看法。
《解決方案》

樓主這個好像不涉及到db啊

[火星人 ] rhcs配置的腳本無法啟動,確認是按照init.d中格式寫的,幫忙看看已經有651次圍觀

http://coctec.com/docs/service/show-post-5462.html