RHCS5.4 qdisk盤的狀態為啥是offline?
最近在練習RHCS5.4,配置了2個節點的集群環境,並且使用了qdisk盤,現在有幾個疑問想諮詢下各位?
1、qdisk為啥是offline?兩台機器都是這樣?
# clustat -l
Cluster Status for test_cluster @ Sun Mar 28 20:37:35 2010
Member Status: Quorate
Member Name ID Status
------ ---- ---- ------
cluster01 1 Online, Local, rgmanager
cluster02 2 Online, rgmanager
/dev/disk/by-path/pci-0000:00:11.0-scsi-0:0:1:0-part1 0 Offline, Quorum Disk
Service Information
------- -----------
Service Name : service:pacs_service
Current State : started (112)
Flags : none (0)
Owner : cluster01
Last Owner : cluster02
Last Transition : Sun Mar 28 10:34:50 2010
# mkqdisk -L
mkqdisk v0.6.0
/dev/disk/by-path/pci-0000:00:11.0-scsi-0:0:1:0-part1:
/dev/sdc1:
Magic: eb7a62c2
Label: ha_qdisk
Created: Sun Mar 28 06:32:18 2010
Host: cluster01.localdomain
Kernel Sector Size: 512
Recorded Sector Size: 512
所有節點通過qdisk -L 查看都正常,我不知道這個qdisk的狀態到底是應該怎樣,請各位都過來談談?
2、在cman_tool status結果輸出中,沒有quorum disk的投票信息?
# cman_tool status
Version: 6.2.0
Config Version: 10
Cluster Name: test_cluster
Cluster Id: 61876
Cluster Member: Yes
Cluster Generation: 344
Membership state: Cluster-Member
Nodes: 2
Expected votes: 2
Total votes: 2
Quorum: 2
Active subsystems: 9
Flags: Dirty
Ports Bound: 0 177
Node name: cluster01
Node ID: 1
Multicast addresses: 239.192.241.166
Node addresses: 192.168.12.182
而正常的好像是這樣的,請各位都談談?
cman_tool status
Version: 6.1.0
Config Version: 32
Cluster Name: MyCluster
Cluster Id: 46516
Cluster Member: Yes
Cluster Generation: 384
Membership state: Cluster-Member
Nodes: 3
Expected votes: 3
Quorum device votes: 2
Total votes: 5
Quorum: 3
Active subsystems: 10
Flags: Dirty
Ports Bound: 0 11 177
Node name: gfs1
Node ID: 1
Multicast addresses: 239.192.181.106
Node addresses: 192.168.101.100
《解決方案》
你應該沒有在配置里添加使用qdisk吧?不然total怎麼會是2?
《解決方案》
或者添加了,沒有修改版本號和同步cluster.conf
《解決方案》
我也遇到這個問題不知道怎麼解決啊,有誰知道啊,指教一下,謝謝了。
《解決方案》
cat /etc/cluster/cluster.conf ?
/var/log/messages有沒有看看呢?
《解決方案》
今天在"jerrywjl "高手的指導之下終於明白了。
<quorumd interval="3" label="qdisk_gfs" min_score="1" tko="10" votes="1">
<heuristic interval="2" program="ping -c 3 -t 2 192.168.1.1" score="3"/>
</quorumd>
才兩個節點應該給一個權重votes="1"就夠了,(1+1+1)/2 +1>=2 集群還是能正常運作的了。這裡面qdisk的故障投票時間為:3X10=30s。
scorer > min_score
注意了這幾個項之後,就可以解決了。再次感謝jerrwjl的幫助。
《解決方案》
呵呵,跟學了!
——————————————————
http://www.hpcservice.org