歡迎您光臨本站 註冊首頁

關於使用RHCS實現拔網線自動切換的問題

←手機掃碼閱讀     火星人 @ 2014-03-04 , reply:0

關於使用RHCS實現拔網線自動切換的問題

環境為兩台redhat as3(未打任何update)+HP MSA500G2盤陣做HA,安裝了clumanager 1.2.3-1,添加service ip時也已經選上了monitor link,但是拔掉當前active結點的網線時無法實現自動切換。但是如果關閉當前active結點資源是可以實現切換的。

謝謝各位大哥指教了
《解決方案》

nntp老大在嗎,麻煩請指點一下迷津吧
《解決方案》

在我拔掉當前active節點的網線后,系統報這樣的錯:
Aug 15 12:30:14 nw1 cluquorumd: <warning> Membership reports member #1 as DOWN, but disk reports as UP: marking as PAN
IC
Aug 15 12:30:14 nw1 cluquorumd: <warning> --> Commencing STONITH <--
Aug 15 12:30:14 nw1 clusvcmgrd: <warning> Member 10.115.5.25's state is uncertain: Some services may be unavailable!
《解決方案》

配置 service的時候, 在Add service 的時候 , 勾上 monitor Link.

手冊肯定沒有看吧? 嘿嘿.

[ 本帖最後由 nntp 於 2006-8-16 13:59 編輯 ]
《解決方案》

nntp老大,您終於出現了,天空一片光芒啊~~~

我很仔細的照看了兩遍紅帽的官方文檔,monitor link選項也選上的,所以我就納悶了

關閉節點切換也正常的,手動切換也正常的,請nntp老大指點啊~~
《解決方案》

pls 貼config出來.
《解決方案》

<?xml version="1.0"?>
<cluconfig version="3.0">
  <clumembd broadcast="yes" interval="750000" loglevel="5" multicast="no" multicast_ipaddress="" thread="yes" tko_count="20"/>
  <cluquorumd loglevel="5" pinginterval="" tiebreaker_ip=""/>
  <clurmtabd loglevel="5" pollinterval="4"/>
  <clusvcmgrd loglevel="5"/>
  <clulockd loglevel="5"/>
  <cluster config_viewnumber="8" key="a3630e768c7ff7028df21e997677caf5" name="test"/>
  <sharedstate driver="libsharedraw.so" rawprimary="/dev/raw/raw1" rawshadow="/dev/raw/raw2" type="raw"/>
  <members>
    <member id="0" name="10.115.5.21" watchdog="yes">
    </member>
    <member id="1" name="10.115.5.22" watchdog="yes"/>
  </members>
  <services>
    <service checkinterval="10" failoverdomain="None" id="0" name="oracle" userscript="/home/oracle.sh">
      <service_ipaddresses>
        <service_ipaddress broadcast="None" id="0" ipaddress="10.115.5.23" monitor_link="1" netmask="255.255.255.0"/>
      </service_ipaddresses>
      <device id="0" name="/dev/cciss/c1d1p1" sharename="">
        <mount forceunmount="yes" fstype="ext3" mountpoint="/oracle" options="rw"/>
      </device>
    </service>
  </services>
  <failoverdomains/>
</cluconfig>
《解決方案》

你fence 用了什麼?

Aug 15 12:30:14 nw1 cluquorumd: <warning> --> Commencing STONITH <--

Shoot
The
Other
Node
In
The
Head
《解決方案》

fence的主要用途是保護共享盤陣上的數據的一致性,也就是防止brain-split,是這樣理解嗎?我是在盤陣上做了rawdevice仲裁來防止這種情況的出現。這樣算不算是在這個HA中沒有配置fence呢?

redhat cluster suite 3中提到了如果有使用了power switchs時可以使用clufence命令,但是我沒有power switchs,是不是就沒法做fence了呢?
《解決方案》

原帖由 yenakata 於 2006-8-16 23:34 發表
fence的主要用途是保護共享盤陣上的數據的一致性,也就是防止brain-split,是這樣理解嗎?我是在盤陣上做了rawdevice仲裁來防止這種情況的出現。這樣算不算是在這個HA中沒有配置fence呢?

redhat cluster suit ...

rawdevice在 v3當中是用來做quorum仲裁關係的,用來每個確定集群成員各自組成集群的投票關係. fence是當你的集群出現brain-split之後,為了在不知道其他成員節點狀態的情況下,採用STONITH的方式把對方成員幹掉,讓其徹底脫離集群的共享存儲和其他資源組,從而保護集群的某節點(通常是主節點)能夠完整不受破壞和干擾的訪問共享資源.

你看 v3 guide的 fence章節,提到了一些fence的配置,v4裡面可以採用好幾種fence, 如果沒有fence,你就得manual fence.

你注意到前面我帖子裡面引用的你的log file么?

集群在監測到你的某個float IP指向的LAN eth 廢掉之後,馬上開始要對你的對方節點 STONITH樂,也就是準備要進行一系列的fence操作來幹掉它.

[ 本帖最後由 nntp 於 2006-8-17 09:02 編輯 ]

[火星人 ] 關於使用RHCS實現拔網線自動切換的問題已經有597次圍觀

http://coctec.com/docs/service/show-post-9133.html