RHCS反覆重新啟動。
2台Dell 1950伺服器,RHEL5.4 64位系統,使用了iscsi存儲,sdb1,Mount至/mnt/ps5000-1 。Fencing設備為Dell DRAC。
eth0 eth1(iscsi) drac
伺服器1: RHCS1 192.168.1.81 10.10.0.81 192.168.1.222
伺服器2: RHCS2 192.168.1.82 10.10.0.82 192.168.1.224
虛擬IP:192.168.1.83
配置完成後,使用clustat查看,現在狀態一直在嘗試啟動中:
# clustat
Cluster Status for rhcsha @ Wed Jun 22 15:42:23 2011
Member Status: Quorate
Member Name ID Status
------ ---- ---- ------
rhcs1 1 Online, rgmanager
rhcs2 2 Online, Local, rgmanager
Service Name Owner (Last) State
------- ---- ----- ------ -----
service:rhcs-service rhcs1 starting
#
附上cluster.conf和message文件供參考。
《解決方案》
回復 1# qinershi
看你的配置文件中沒有配置腳本,你日誌里怎麼有?
Jun 22 15:27:34 rhcs2 clurgmgrd: : <err> script:rhcs-script: start of /etc/rc.d/init.d/httpd failed (returned 1)
Jun 22 15:27:34 rhcs2 clurgmgrd: <notice> start on script "rhcs-script" returned 1 (generic error)
Jun 22 15:27:34 rhcs2 clurgmgrd: <warning> #68: Failed to start service:rhcs-service; return value: 1
《解決方案》
回復 2# tanyangxf
第一次配置時加了Httpd腳本,但沒有配置apache,就開始測試HA功能,因此就把腳本給取消了,資源里只有共享存儲和IP。我晚上再嘗試配置好Apache后測試一次。
《解決方案》
回復 3# qinershi
看了下,那是你最後的日誌啊,去掉腳本之後cman重啟過沒?
《解決方案》
又重新看了下配置,貌似沒有保存成功。現在狀態正常了。
# clustat
Cluster Status for rhcsha @ Wed Jun 22 21:26:23 2011
Member Status: Quorate
Member Name ID Status
------ ---- ---- ------
rhcs1 1 Online, Local, rgmanager
rhcs2 2 Online, rgmanager
Service Name Owner (Last) State
------- ---- ----- ------ -----
service:rhcs-service rhcs1 started
在RHCS1重啟時,可以切換至RHCS2了,使用PING命令檢測,大約丟了4個包。
但重啟RHCS2時,Owner不會轉移到RHCS1,觀察了10分鐘,虛擬IP仍舊無法PING通。
《解決方案》
繼續分析,分現RHCS1上的Rgmanager服務沒有自動啟動,導致無法自動切換。再次測試,目前正常了。
《解決方案》
回復 6# qinershi
改了配置之後,必須重啟cman服務,一切正常之後在啟動rgmanager服務,如果資源沒起來,看日誌,出了什麼問題,一個一個資源去掉,看能不能啟動。直到找到那個不能啟動的資源為止,然後找原因:mrgreen:
《解決方案》
回復 7# tanyangxf
多謝指點。繼續研究ing
《解決方案》
回復 qinershi
改了配置之後,必須重啟cman服務,一切正常之後在啟動rgmanager服務,如果資源沒 ...
tanyangxf 發表於 2011-06-22 23:05 http://bbs.chinaunix.net/images/common/back.gif
總結的給力,幫頂!
《解決方案》
總結的給力,幫頂!