rhcs 5.1 集群問題 急
:em02: 各位老大:
下面是我的步驟:
1、配置/etc/hosts文件
# Do not remove the following line, or various programs
# that require network functionality will fail.
127.0.0.1 localhost.localdomain localhost
172.168.168.171 node_o.localdomain node_o(第一個節點)
172.168.168.172 node_t.localdomain node_t(第二個節點)
172.168.168.173 server.localdomain server(gfs文件伺服器)
172.168.168.175 ha.localdomain ha (對外所見的ip)
~
2、配置cluster。conf
<?xml version="1.0"?>
<cluster config_version="1" name="cluster_test">
<fence_daemon post_fail_delay="0" post_join_delay="3"/>
<clusternodes>
<clusternode name="node_o" nodeid="1" votes="1">
<fence>
<method name="1">
<device name="F-Man" nodename="node_o" ipaddr="192.168.168.171"/>
</method>
</fence>
</clusternode>
<clusternode name="node_t" nodeid="2" votes="1">
<fence>
<method name="1">
<device name="F-Man" nodename="node_t" ipaddr="192.168.168.172"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman expected_votes="1" two_node="1"/>
<fencedevices>
<fencedevice agent="fence_manual" name="F-Man"/>
</fencedevices>
<rm>
<failoverdomains>
<failoverdomain name="web_failover" ordered="0" restricted="0">
<failoverdomainnode name="node_o" priority="1"/>
<failoverdomainnode name="node_t" priority="1"/>
</failoverdomain>
</failoverdomains>
<resources>
<ip address="192.168.168.175" monitor_link="1"/>
<clusterfs device="/dev/gnbd/gfs" force_unmount="0" fstype="gfs" mountpoint="/gfs" name="web_content" options="-t gfs"/>
</resources>
<service autostart="1" domain="web_failover" name="web" recovery="relocate">
<ip ref="192.168.168.175"/>
<script file="/etc/init.d/httpd" name="httpd"/>
<clusterfs ref="web_content"/>
</service>
</rm>
</cluster>
3、沒有導入和導出gfs,直接運行
service ccsd start
service cman start
問題就出現了,啟動cman 時提示:
Starting cluster:
Loading modules... done
Mounting configfs... done
Starting ccsd... done
Starting cman... failed
cman not started: Can't find local node name in cluster.conf /usr/sbin/cman_tool: aisexec daemon didn't start
各位老大,請問誰知道是什麼原因啊,謝謝大家了!
《解決方案》
自己頂一下
請問是不是先要配置gfs文件的原因呢,但是我的得兩個機子互聯測試的話,應該不需要文件系統啊,謝謝了
《解決方案》
再頂
我覺得關鍵是 local node name 的問題,但是我反反覆複檢查,名字沒有錯誤的啊,鬱悶
《解決方案》
弄了半天,結果可能是主機名的問題
我現在兩台機器互ping ip都能成功 但是一把ip換成主機名就不行了 我的/etc/hosts /etc/sysconfig/network 兩個文件都改了主機名 ping 的時候也能把主機名解析成ip地址 單就是ping主機名有發包沒有回包
但是一直想不通為什麼~~~~~~~~~~~~
《解決方案》
暈死 找到原因了
原因找到了,我要暈死了,犯了個低級錯誤,hosts文件里的ip和cluster.conf裡面的ip不一樣 暈死 徹底暈死
《解決方案》
感謝分享,呵呵 !
《解決方案》
:lol: :lol: :lol: :lol: :lol: