歡迎您光臨本站 註冊首頁

關於fence_ilo的一些問題

←手機掃碼閱讀     火星人 @ 2014-03-04 , reply:0

關於fence_ilo的一些問題

我的環境是兩台刀片 HPBL25P REDHAT LINUX AS 4.0 (U3 ) REDHAT CLUSTER SUITE 4 (U3)
1、fence配置是否是必須的
2、怎麼配置fence呢?
3、我將ilo連接到一個交換機。然後分別在兩台機器上分別加了兩個fence.是不是這樣就可以了。是不是主機的ip地址要和ilo設置在同一個網段,在主機上要能登到ilo口呢?還是ilo相互能夠通信就可以了?
4、我按照說明配置了一下,測試了一下.將其中A主機poweroff,然後就沒有啟動了。我的理解是B主機可以通過fence_ilo登錄到A機的ilo口將其啟動。我運行fence_ilo -a -l -p reboot 命令執行不了,一直卡在那裡。
5、怎麼測試fence是否起作用?
《解決方案》

1. 必須的,不配fence,你的集群可以跑起來,但是不算配好了,因為RHCS無法通過一個途徑來阻止一個failed node和healthy node來競爭shared resource,比如 shared lun從而破壞掉上面的數據

2. 看手冊,白紙黑字+截圖都在手冊裡面,手冊沒有仔細從頭到尾看過三遍的,就不要在這裡提問了,省得別人copy給你答案.

3. iLO是 proliant 上的一組控制系統,露在外面有一個iLO口,連的是一個100MB網卡,iLO晶元裡面是vxwork寫的一個嵌入式OS,並且有web server. 你就把iLO當作伺服器裡面的伺服器來配. iLO口默認是dhcp的,你可以修改成static IP, 密碼和口令都在你刀片前面粘貼的那個印刷的白條上,你可以可以從SIM/RDP讀到iLO的DNS name(如果你用SIM的話).  iLO的地址配製成和伺服器網卡一樣或不一樣的並不重要,但是我建議配成不一樣的,但是所有的iLO口必須配成一個網段的.

主機不需要登陸iLO, 你的管理站登陸iLO的時候,管理站的網路設置把iLO網段考慮進去即可,反正都是內網,隨便你自己怎麼弄了,這個都是最初步的網路設置,我就不廢話了.

4. RHCS的fence_iLO設計是這樣的,當你的某個node被heartbeat 到發現問題之後,cluster決定開始fence后,就從健康的node 通過SSL,按照你配置階段設置的fence device的參數,傳送一個message給 對方的iLO地址,iLO因為獨立於操作系統的,只要哪個伺服器還有電在上面,iLO就獨立工作,按照最標準的SSL接到message之後, power cycle這個node, 這個工作是iLO 直接通過晶元組和伺服器主晶元組進行通信控制的結果, 不涉及到任何干預當前這個需要fence的node的OS的範疇.

5. 手冊裡面有幾種不同類型的測試方法,仔細看吧.

6. 既然買了or 準備買 hp和redhat的產品/服務,第一個需要找的不是chinaunix而是廠商,這裡有再高的高人,在牛B的專家,也不能和正規的支持流程和一個support team相提並論.更何況伺服器和OS/Cluster都是直接來自這兩個廠商自己的研發.

good luck,

[ 本帖最後由 nntp 於 2006-5-20 04:04 編輯 ]
《解決方案》

謝謝,版主辛苦了。我在努力。我剛學linux一個月。提出了一些幼稚的問題請版主諒解哈。基本上清楚了。謝謝了.
《解決方案》

nntp說的 很對,如果兩台hp刀片伺服器組成的redhat cluster環境(一台跑應用,一台跑oracle),
兩台伺服器都通過各自的 ilo來當作各自的fence設備,
如果我拔掉一台其中的一台伺服器(使其一台ilo設備都斷電),就切換不過去了,感覺是當節點偵測到對方服務發生異常時,hp的內置ilo是通過fence_ilo命令去fence對方,如果fence返回succes則服務能切換正常,假如對方的fence設備沒電了,也就無法返回succes,那麼切換也就會失敗了,能不能通過另外一種保險的方法來設置fence設備呢?

[火星人 ] 關於fence_ilo的一些問題已經有711次圍觀

http://coctec.com/docs/service/show-post-7181.html