歡迎您光臨本站 註冊首頁

《CU訪談錄——IT技術人的故事》(第十一期 運維總監"king_819")

大家好非常高興今天能邀請到CU社區熱心網友蘇州某企業運維總監king-819來跟大家分享下企業運維中的經驗。

擅長領域: 伺服器集群(centos、freebsd) 網路架構(跨ISP、跨機房) 網路安全   

無風之谷:
Hi king兄,先給CU社區的網友打聲招呼,介紹下自己嘛。

king_819:
HI,CU的兄弟們大家好,我是kerry(聆聽未來),在罈子里的ID是king_819,目前在一家遊戲公司從事運維工作

無風之谷:
king兄,作為IT企業運維總監,在你眼裡,企業運維的職責是什麼?

king_819:
運維成本的控制:ISP、機房的選擇、網路設備及伺服器型號的選擇、「新」技術的應用
網路架構的設計與搭建:網路設備及伺服器的規劃和布署
應用系統架構的設計與搭建:高負載、高可用、高伸縮、高容災並能實時監控
運維自動化:批量的自動化布署
網路安全:防攻擊、合理分配許可權、日誌審查
應急響應:應急預案,快速響應並解決問題
團隊建設:打造一支團結有創新意識的團隊

無風之谷:
我記得某IT網站把運維工程師這麼形容,「戰地工程兵」「機房清潔工」「洪水救災員」等等,您是如何看待這個問題的?

king_819:
哈哈。。這樣看來我們的運維工程師是無所不能啊,為了公司的網路系統能安全穩定的運行,可謂是跋山涉水,不怕臟、不怕苦、不怕累了,不過做為一個運維工程師,這些基本的條件也是必須具備的,但不意味著我們的運維工程師就只是拉拉網線、殺殺病毒、裝裝系統、把伺服器弄上線能正常訪問了,有問題了再這修修、那補補就完事了,我覺得應該從更高的角度來看待運維工程師這個工作崗位,如何在保證業務穩定、有效的對外提供服務的情況下降低運維成本?如何在大批量布署系統、應用程序的情況下提高效率,在短時間內讓業務快速上線,並安全穩定的運行?如何防止大量的網路攻擊?如何保證網路系統構架、應用系統架構的高擴展性、高容災性?如何更好的跟其他部門配合,合理的分配資源,共享信息,讓業務系統更安全穩定的運行?運維成本系統架構的整體規劃、運維成本的控制、批量的自動布署、各部門之間的相互配合、網路系統的實時監控、網路系統的擴展、數據分析、網路安全、安全審計、各種事故的應急響應,這些都是我們要考慮的,要努力去做好的

無風之谷:
說起運維,我們不得不說IDC運營商選擇的問題,伺服器多了,自然要找好的IDC運營商,否則會出現機房網路被攻擊,電源跳閘之類的,帶寬流量無法實時監控等等各種悲劇!您是如何選擇IDC運營商的?

king_819:
說起IDC運營商的選擇,這個確實是比較關鍵的一步,不光要考慮成本,還要考慮穩定性和帶寬質量,電源和空調系統的不穩定確實比較麻煩,最可恨的就是頻繁的被攻擊,再就是應急響應的速度和能力,所以我們在選擇IDC運營商合作的時候是比較慎重的,一是根據自己的經驗,二是根椐朋友的介紹和在業界的口碑,三是前期的線路測試,會放一些不是核心業務的應用上去進行一段時間的壓力測試,以檢驗IDC運營商的性能,達到要求了則與之合作

無風之谷:
核心業務和IT系統息息相關,一旦網路出現了故障,影響和損失非常巨大。所以,傳統的管理模式只能導致"出現問題后被動響應",而這種解決問題的效率和質量相當低,對於這種問題,您是如何解決的?

king_819:
當今的互聯網行業競爭激烈,不光要穩定,還要快速的對外提供服務,一但出現故障對企業的影響和損失是很大的,所以在網路和應用系統架構設計的時候就要求充分的考慮高可用、高負載、高容災這些東西,避免任何一個單點故障,這裡應用最多的就是負載均衡、故障轉移技術了

無風之谷:
流量大了,或者業務重要性高,就要求最大可能提供伺服器的高可用性和數據容災,自然要部署負載均衡和故障轉移;是採用硬體F5,cisco還是軟體lvs,keepalvie,heartbeat,nginx方式實現,效果如何?king兄是怎麼選擇的?

king_819:
為了避免單點故障,就不得不考慮負載均衡、故障轉移技術了,F5、NetScaler這些硬體負載均衡器不光成熟穩定而且還有專業的團隊為你保駕護航,但花銷也是高高的,對於開源項目的負載均衡器現在用的最多的應該就屬LVS+keeplived了,LVS成熟、穩定,生產環境中的真實案例也是比較的多,抗負載能力強,我所經歷的項目基本上都是用的LVS/DR+keeplived 做負載均衡,最近的nginx做為後起之秀可謂是無所不能,負載均衡模塊對網路的依賴較小,理論上只要能ping就可以實現負載均衡,相對來說LVS對網路環境的要求就比較的高了,如果網路環境比較複雜的,可以選擇nginx+keeplived作為負載均衡器,nginx負載均衡類似於LVS服務的nat模式,如果後端的web伺服器大於10,可能會出現性能瓶頸,具體用什麼?怎麼用?還得看大家具體的需求,根椐需求來選擇負載均衡器

無風之谷:
千金易得,一將難求。對於企業來講,運維人才的流失是比較可惜的,作為運維總監,king兄是如何去留住一批優秀的運維人才又是如何招聘新人的呢?

king_819:
隨著年輕人的生活壓力增大,再加上互聯網行業的浮躁,大量的熱錢進入這個行業,造成行業內跳槽頻繁,團隊的穩定和完善是做為一個管理者不得不認真對待的一個問題;
關於如何去留住一批優秀的運維人,第一當然是要給他一個有競爭力的薪資待遇,這是一個比較現實的問題;第二就是要有一個很好的發揮、成長空間,爭取人人可以做項目經理,人人可以帶團隊,學以致用,互相學習,不斷提高;第三就是合理的考評、晉陞制度;第四就是富有激情的團隊氛圍;第五就是更多的學習培訓機會;
關於如何招聘新人,第一就是要找一個合適的人,必須要符合崗位要求的基本技能;第二能力為先,不需要花架子;第三要富有團隊意識;第四知識面要廣;第五學習能力、領悟能力、創新意識要強

無風之谷:
很多人都說運維是個年輕人行業,做運維的需要夢想和激情,隨著歲月的增長和學習能力,熬夜能力的衰退;運維人員要面臨轉型的問題,king兄是如何看待運維人員職業發展這個問題的?

king_819:
運維這個崗位本身技術含蓋了很多方面,系統、網路、應用、存儲、安全、監控、資料庫、虛擬化、雲計算等,相對來說運維人員要轉型方向還是挺多的,這就要看個人擅長哪一方面,再加上興趣和愛好了,不管哪一個方向,做深了,前途都是無可限量的。

本期採訪到此結束,有關您在運維方面遇到的問題,您可以跟帖提問,king會為您詳細解答!
更多採訪請關註:http://star.chinaunix.net/  ChinaUnix訪談錄——權威的IT專家技術分享平台
《解決方案》

支持下
《解決方案》

支持:emn10:
《解決方案》

運維工程師都幸福:em28:
《解決方案》

支持,說得很不錯
《解決方案》

剛從事運維三個月的IT小白,我,表示受益了!!
《解決方案》

支持King兄!!
《解決方案》

支持King兄!!
yuhongchun 發表於 2011-11-01 08:57 http://bbs.chinaunix.net/images/common/back.gif


  謝謝酒哥的支持!
《解決方案》

運維工程師都幸福
藍色蟲 發表於 2011-10-31 22:02 http://bbs.chinaunix.net/images/common/back.gif


  哈哈。。幸苦並幸福著!!
《解決方案》

這個有啟發

[火星人 ] 《CU訪談錄——IT技術人的故事》(第十一期 運維總監"king_819")已經有416次圍觀

http://coctec.com/docs/service/show-post-696.html