解決了
剛接觸這個沒幾天,以前沒玩過集群,現在公司有任務,需要我去配置起來,2台Cent OS UP4,
uname -a
Linux CH2 2.6.9-42.ELsmp #1 SMP Sat Aug 12 09:39:11 CDT 2006 i686 i686 i386 GNU/Linux
安裝之前,看了一下rh-gfs-en-6_1的PDF。。安裝了需要的CS和GFS安裝包,沒裝圖形界面,只能用命令行來操作
修改了/etc/hosts,
127.0.0.1 CH2 localhost.localdomain localhost
192.168.3.12 CH2 #第一台
192.168.3.11 CH6 #第二台
貼下我的/etc/cluster/cluster.conf文件
<?xml version="1.0"?>
<cluster config_version="2" name="ba880_cluster">
<fence_daemon clean_start="0" post_fail_delay="0" post_join_delay="3"/>
<clusternodes>
<clusternode name="CH6" votes="1">
<fence>
<method name="1">
<device name="myfencing1" nodename="CH6"/>
</method>
</fence>
</clusternode>
<clusternode name="CH2" votes="1">
<fence>
<method name="1">
<device name="myfencing2" nodename="CH2"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman two_node="1" expected_votes="1"/>
然後執行起服務腳本
service ccsd start
service cman start
service fenced start
service clvmd start
service gfs start
service rgmanager start
出現了Starting ccsd: [ OK ]
Starting cman:
Starting fence domain:
Starting clvmd: clvmd could not connect to cluster manager
Consult syslog for more information
Starting Cluster Service Manager: [ OK ]
只有CCSD可以起,其餘的都有問題,
看/var/log/messages日誌:
Mar 14 10:15:49 CH6 ccsd: Starting ccsd 1.0.7:
Mar 14 10:15:49 CH6 ccsd: Built: Aug 25 2006 15:00:06
Mar 14 10:15:49 CH6 ccsd: Copyright (C) Red Hat, Inc. 2004 All rights reserved.
Mar 14 10:15:49 CH6 ccsd: succeeded
Mar 14 10:15:49 CH6 kernel: CMAN 2.6.9-45.4.centos4 (built Aug 25 2006 14:55:06) installed
Mar 14 10:15:49 CH6 kernel: NET: Registered protocol family 30
Mar 14 10:15:49 CH6 kernel: DLM 2.6.9-42.12.centos4 (built Aug 25 2006 15:22:35) installed
Mar 14 10:15:49 CH6 ccsd: cluster.conf (cluster name = ba880_cluster, version = 2) found.
Mar 14 10:15:50 CH6 cman: cman_tool: Can't find broadcast address for node CH6 failed
Mar 14 10:15:50 CH6 fenced: startup failed
Mar 14 10:15:50 CH6 clvmd: Can't open cluster manager socket: Network is down
Mar 14 10:15:56 CH6 clvmd: clvmd could not connect to cluster manager
Mar 14 10:15:56 CH6 clvmd: Consult syslog for more information
Mar 14 10:15:56 CH6 clvmd: clvmd startup failed
Mar 14 10:15:56 CH6 ccsd: Cluster is not quorate. Refusing connection.
Mar 14 10:15:56 CH6 ccsd: Error while processing connect: Connection refused
Mar 14 10:15:56 CH6 ccsd: Invalid descriptor specified (-111).
Mar 14 10:15:56 CH6 ccsd: Someone may be attempting something evil.
Mar 14 10:15:56 CH6 ccsd: Error while processing get: Invalid request descriptor
Mar 14 10:15:56 CH6 ccsd: Invalid descriptor specified (-111).
Mar 14 10:15:56 CH6 ccsd: Someone may be attempting something evil.
Mar 14 10:15:56 CH6 ccsd: Error while processing get: Invalid request descriptor
Mar 14 10:15:56 CH6 ccsd: Invalid descriptor specified (-21).
Mar 14 10:15:56 CH6 ccsd: Someone may be attempting something evil.
Mar 14 10:15:56 CH6 ccsd: Error while processing disconnect: Invalid request descriptor
Mar 14 10:15:56 CH6 clurgmgrd: <notice> Resource Group Manager Starting
Mar 14 10:15:56 CH6 clurgmgrd: <info> Loading Service Data
Mar 14 10:15:56 CH6 rgmanager: clurgmgrd startup succeeded
Mar 14 10:15:56 CH6 ccsd: Cluster is not quorate. Refusing connection.
Mar 14 10:15:56 CH6 ccsd: Error while processing connect: Connection refused
Mar 14 10:15:56 CH6 clurgmgrd: <crit> #5: Couldn't connect to ccsd!
Mar 14 10:15:56 CH6 clurgmgrd: <crit> #8: Couldn't initialize services
不知道哪裡有問題,可能我犯了什麼錯誤,請提示一下,也許有些概念很模糊,或者說很外行,但我也是想學的,由於時間原因,想快點把這個任務完成,所以發個帖子看能不能找到什麼問題。。謝謝,我也一直在找資料找問題
[ 本帖最後由 joan8363 於 2007-3-14 11:23 編輯 ]
《解決方案》
cman: cman_tool: Can't find broadcast address for node CH6 failed
這個是核心問題,
《解決方案》
inet addr:192.168.3.11 Bcast:192.168.3.255 Mask:255.255.255.0
糊塗了。。廣播地址找不到?
這個是cluster.conf原因還是cman_tool原因還是linux ip設置原因???
《解決方案》
是不是沒有設置心跳方式? 有個地方可以設置broadcast和multicast的
[ 本帖最後由 ljhb 於 2007-3-14 10:41 編輯 ]
《解決方案》
原帖由 ljhb 於 2007-3-14 10:39 發表於 4樓
是不是沒有設置心跳方式? 有個地方可以設置broadcast和multicast的
何為心跳方式啊??做AIX的HA有心跳線,這裡不需要吧??
剛開始配,不是很熟,看了CU的一些文檔,但還是出現了這個問題,卡住了
《解決方案》
在2台上面運行/sbin/cman_tool join都報一樣的這個錯誤
/sbin/cman_tool: Can't find broadcast address for node CH2(CH6)
《解決方案》
問題解決了沒有?如果沒有解決,我可以幫助你你.
《解決方案》
我也遇到了這個問題,請教該如何解決呀?老闆在催,急死了!
《解決方案》
配置文件hosts有問題.
127.0.0.1 CH2 定義和下面的重複.
[ 本帖最後由 wysilly 於 2007-7-10 21:57 編輯 ]
《解決方案》
我的HOST文件是這樣的:
192.168.21.131 centos-linux
192.168.21.132 centos-linux2
127.0.0.1 localhost.localdomain localhost
這個應該沒有問題吧?