歡迎您光臨本站 註冊首頁

小公司如何部署實施Linux集群網站

←手機掃碼閱讀     火星人 @ 2014-03-12 , reply:0
  

 其實在許多小公司和小企業里,尤其是牽涉到電子商務和電子廣告類的網站,他們的網站也要求作負載均衡高可用的Linux集群,但由於成本的制約,老闆都會要求系統架構師設計的方案能夠用最少的錢實現這個要求,作為系統架構師的我們,應該如何實現這個要求呢?

  首先是機房的選擇,如果公司有自己的機房那是最好不過的了;如果沒有自己的機房,我建議大家放在BGP機房內託管,如果有選擇的話,最好是選擇帶有硬體防火牆的機房,這樣在安全方面也有保障;另外,我們如何選擇伺服器呢?在有了負載均衡高可用的集群環境后,我們完全可以自己組裝伺服器,這樣在性價比上也是最高的。像IBM和DELL的品牌伺服器,雖然質量有保障,但價格往往是老闆不能夠接受的。當然了,一切以穩定為前提和原則。

  首先是負載均衡設備的選擇。我們可以有二種選擇,一種是通過硬體來進行進行,常見的硬體有比較昂貴的NetScaler、F5、Radware和Array等商用的負載均衡器,它的優點就是有專業的維護團隊來對這些服務進行維護、缺點就是花銷太大,所以對於規模較小的網路服務來說暫時還沒有需要使用;另外一種就是類似於LVS/HAProxy、 Nginx的基於Linux的開源免費的負載均衡軟體策略,這些都是通過軟體級別來實現,所以費用非常低廉,小公司和小企業由於費用的問題,所以軟體級別的負載均衡是第一選擇。

  至於負載均衡高可用架構,我首推是Nginx/HAProxy+Keepalived的架構,這時很多朋友就有疑問,說你為什麼不選擇基於LVS+Keepalived的集群方案呢?這是因為我們部署的網站一般都會有動靜分離、正則分發的需求,如果我們最前面選用LVS+Keepliaved的架構,那麼我們至少又要在中間加一層二級負載均衡的機器,這樣比較耗機器,無形中也會增加整個網站的成本;另外,很多朋友都比較擔心的一個問題,說Nginx/HAProxy+Keepalived的穩定性不如LVS+Keepalived,這個其實是誤解;我們通過十幾個項目的成功實施,再加上幾年的觀察期,發現這些軟體級別的負載均衡器的穩定性確實很好,在高併發的情況下宕機的可能性微乎其微,而近段時間實施的一個商業網站,用的是HAProxy+Keepalived,在億/日高併發流量的衝擊下,HAProxy穩如磐石。LVS在性能方面是最好的,尤其是後面的節點(如Web或MySQL資料庫伺服器)超過10台時,它的性能是最優異的。而小公司的併發和流量一般不是特別大,大概一天持續在100萬/日之間,所以我這裡也向大家推薦Nginx/HAProxy+Keepalived。

  如果網站是放在IDC機房託管,而機房最前面也沒有硬體防火牆防護時,這時候大家盡量做好流量監控的工作,我一般會在主Nginx/HAProxy上安裝MRTG+Nload軟體來對流量進行監控,Nload可以對流量進行即時監控,它的安裝也是很簡單的,我們先安裝好RPMForege。RPMforge是Centos系統下的軟體倉庫,擁用4000多種的軟體包,被Centos社區認為是最安全也是最穩定的一個軟體倉庫,地址為http://pkgs.repoforge.org/rmpforge-release。這個安裝成功以後,我們可以通過命令yum -y install nload很輕鬆的安裝nload。輸入此命令后,nload軟體會很直觀的顯示流量的即時狀態,上半部分ncoming是進入網卡的流量,下半部分Outgoing是從這塊網卡出去的流量,每部分都有當前流量(Curr)、平均流量(Avg)、最小流量(Min)、最大流量(Max)、總流量(Ttl)。由於此軟體比較直觀,我用它來取代之前的即時流量監控軟體iptraf,Nload的工作界面如下所示:

  許多對集群感興趣的朋友經常問我,如果網站要部署負載均衡高可用的Linux集群方案,而公司又想用最節省成本的方式來實施的話,一般需要幾台伺服器呢?我的回答是四台,即2+2架構,最前面是二台Nginx/HAProxy+Keeplaived機器,後面是二台配置比較好的Web機器,MySQL資料庫採用一主一從的方式,分別放在二台Web機器上,監控的Nagios部署在從Nginx/HAProxy機器上,流量監控我一般放主Nginx/HAProxy,軟體採用的是MRTG+Nload的方式,伺服器之間的數據同步我採用的是rsync+inotify的方法,當然更多時候,我採用的是純rsync方式,這樣是避免網站有大文件發生改動的時候會產生頻繁讀盤的麻煩;當然了,如果大家的公司對文件伺服器有更高要求的時候(比如圖片類型的),我們可以考慮再增加二台伺服器,做成DRBD+Heartbeat+NFS的方式;如果有海量文件需要存儲的話,我們可以考慮用MFS,當然這樣也是比較耗機器的。

  像類似以上的小公司集群架構里,我們是如何解決session同步的問題呢?我們可以採用Nginx的ip_hash和HAProxy的balance source機制,它們的原理比較類似,都會讓某一客戶機在相當長的一段時間內只訪問固定的後端的某台真實的Web伺服器,這樣會話就會得以保持,我們在網站頁面進行login的時候,就不會在二台Web伺服器之間跳來跳去了,自然也不會出現登陸一次后網站又提醒你沒有登陸,需要重新登陸的情況。

  另外,小公司的Web伺服器我們至少有二種選擇:一種是Apache,另一種是Nginx,在流量和併發不大的環境下,我們完全可以選擇Apache作為我們的Web伺服器,雖然它的抗併發能力不高,但它的穩定性是最好的,我的許多電子商務網站都是基於Apache;而大流量大併發的環境,我比較傾向於Nginx。

  MySQL在這裡我用的就是一主一從的設計,雖然很多朋友覺得這種設計比較簡單,但事實證明,它也最穩定的。我的電子商務網站也是採用這種架構,幾年下來,從沒有因為資料庫的故障發生過丟單現象,網站上線的前期階段,我們可以通過PHP程序,把後台的查詢功能的入口選擇Slave機器,這樣可以大大減少主資料庫的壓力;另外,從MySQL機器並非僅僅只起一個備份和備機的作用,我們完全通過PHP程序將後台的複雜查詢轉到從MySQL機器上。當然了,MySQL的主從複製狀態監控也是非常重要的,我一般是通過Nagios和SHELL腳本雙監控的方式。

  如何能幫企業節約和省錢,這其實也是系統管理員/架構師的一項工作職責,希望大家在工作中能領悟到這點。

  作者介紹:

  余洪春(撫琴煮酒·微博),《構建高可用Linux伺服器》一書作者,一拍網系統架構師、資深項目管理工程師,ChinaUnix集群和高可用版版主。



[火星人 ] 小公司如何部署實施Linux集群網站已經有768次圍觀

http://coctec.com/docs/enterprise/show-post-73109.html