請教一下 RHCS的問題
我們實驗室想進行并行計算。
系統是RHEL 5,已經安裝好了MPIch2。
現在是想建立GFS文件系統,以便能進行計算結果的數據交換。
使用RHCS的system-config-cluster,最簡單建立兩台計算機的cluster,
fence 採用manual fence
faildomain 沒有設置
service 也沒有設置
在兩台計算機啟動
service cman start
service clvmd start
service rgmanager start
都成功。
但是重新打開system-config-cluster,
RHCS還是提示本節點沒有加入cluster,不知道為何會出現這個問題,請教一下。
我的郵箱是volk001@163.com
qq:31931941
《解決方案》
能貼一下你的cluster.conf嗎?
能貼一下你的cluster.conf嗎?
啟動fenced 了嗎
《解決方案》
為什麼要用GFS文件系統? 有同步存儲文件么?
《解決方案》
<?xml version="1.0" ?>
<cluster alias="nint" config_version="2" name="nint">
<fence_daemon post_fail_delay="0" post_join_delay="3"/>
<clusternodes>
<clusternode name="lxz.nint0502" nodeid="1" votes="1">
<fence>
<method name="1">
<device name="mau" nodename="lxz.nint0502"/>
</method>
</fence>
</clusternode>
<clusternode name="czg2.nint" nodeid="2" votes="1">
<fence>
<method name="1">
<device name="mau" nodename="czg2.nint"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman expected_votes="1" two_node="1"/>
<fencedevices>
<fencedevice agent="fence_manual" name="mau"/>
</fencedevices>
<rm>
<failoverdomains>
<failoverdomain name="fail" ordered="0" restricted="0">
<failoverdomainnode name="lxz.nint0502" priority="1"/>
<failoverdomainnode name="czg2.nint" priority="1"/>
</failoverdomain>
</failoverdomains>
<resources>
<ip address="10.1.5.169" monitor_link="1"/>
<script file="/etc/init.d/cluster" name="cluster"/>
</resources>
</rm>
</cluster>
兩台主機作實驗, 在system-config-cluster下設置的
[ 本帖最後由 volk 於 2007-5-12 22:55 編輯 ]
《解決方案》
我感覺mpi的并行集群,用NFS共享就可以滿足需求了..
《解決方案》
傻啊 , 進程沒有全起來 。 再有就是 配置文件。。。。。
《解決方案》
我是初學者,能具體請教一下你嗎?
我的qq:31931941
郵件:volk001@163.com
原帖由 haishen 於 2007-5-13 10:03 發表於 6樓
傻啊 , 進程沒有全起來 。 再有就是 配置文件。。。。。
《解決方案》
原帖由 volk 於 2007-5-11 11:23 發表於 1樓
我們實驗室想進行并行計算。
系統是RHEL 5,已經安裝好了MPIch2。
現在是想建立GFS文件系統,以便能進行計算結果的數據交換。
使用RHCS的system-config-cluster,最簡單建立兩台計算機的cluster,
fence ...
要使用GFS就需要安裝GFS,你沒有安裝gfs的軟體當讓沒有GFS包了.
《解決方案》
MPICH和RHCS沒有必然的聯繫吧
《解決方案》
原帖由 我愛釣魚 於 2007-5-12 23:06 發表於 5樓
我感覺mpi的并行集群,用NFS共享就可以滿足需求了..
我甚至覺得用GFS是一種負擔和浪費.:P :P