歡迎您光臨本站 註冊首頁

「閉源」微軟擁抱開源Hadoop欲何為?

←手機掃碼閱讀     火星人 @ 2014-03-12 , reply:0
  

 微軟近日宣布正在開發適用於Windows Server與Windows Azure平台的開源Hadoop框架。而一向對開源趨勢不屑一顧的微軟為何大張旗鼓,加入開源陣營,聲稱支持Hadoop呢?那麼Hadoop有什麼特別的優點呢?本文將為您揭曉答案。

  Hadoop體系架構

  Hadoop是一個分散式系統基礎架構,由Apache基金會開發。Hadoop的主要目標是對分散式環境下的“大數據”以一種可靠、高效、可伸縮的方式處理。設想一個場景,假如您需要grep一個100TB的大數據文件,按照傳統的方式,會花費很長時間,而這正是Hadoop所需要考慮的效率問題。

  Hadoop主要由三部分組成:HDFS(Hadoop Distributed File System),MapReduce與Hbase。

  HDFS是Hadoop分散式文件系統,它的主要設計目標是對成百上千的伺服器集群導致的硬體錯誤檢測和快速、自動的恢復能力,大數據文件的存儲,數據的高吞吐量等。

 

      MapReduce是一種編程模型,用於大規模數據集(大於1TB)的并行運算。MapReduce的設計目標是方便編程人員在不熟悉分散式并行編程的情況下,將自己的程序運行在分散式系統上。

  HBase是一個分散式的、面向列的開源資料庫,由Apache基金會開發。HBase不同於一般的關係資料庫,它是一個適合於非結構化數據存儲的資料庫。它基於列的而不是基於行的模式。

  總之,Hadoop作為一種分散式基礎架構,可以使用戶在不了解分散式底層細節的情況下,開發分散式程序。值得一提的是,Hadoop與Google有著千絲萬縷的聯繫。Hadoop主要是由HDFS、MapReduce和Hbase組成。而HDFS是Google File System(GFS)的開源實現,MapReduce是Google MapReduce的開源實現,HBase是Google BigTable的開源實現。

  微軟支持Hadoop只為“龐大數據問題的通用解決方案”

       而一向對開源趨勢不屑一顧的微軟為何大張旗鼓,揚言聲稱支持Hadoop呢?大家知道,開源領域的核心角色是“Linux”,而Linux對於微軟賴以生存的操作系統業務無疑是一種巨大的威脅。

  不過,正所謂沒有永遠的朋友,只有永遠的利益。考慮到Hadoop在應對大規模非結構型數據中所起到的重要作用,微軟也不得不放下架子,宣布對Hadoop提供支持。而實際上,微軟加入開源隊伍也不是頭一遭了。事實上,微軟多年來一直積極關注開源項目。例如,對jQuery的支持,是微軟正式將開源項目納入自身主流業務的最顯著徵兆。

  另一方面,開源項目曾經一度全方位落後於專有型軟體,無論是質量、用戶界面還是文件編製方面,而那個時代已經一去不復返了。Accenture諮詢公司的研究調查表明,技術行業中最具創新性的工作往往出現在開源社區內,而非傳統意義上的專有軟體開發團隊。難怪思科的James Urquhart推斷:“Hadoop可以說是不涉及任何現有專利的開源項目在企業軟體方面所取得的首個裡程碑式成功。”

  微軟加入Hadoop后從技術角度的解讀

  總之,Hadoop不象Linux那樣,永遠沒有與微軟結緣的可能。Hadoop在業界有“龐大數據問題的通用解決方案”的頭銜。它可以作為微軟SQL Server及Azure系列產品的一大重要補充方案而存在。而微軟最看重的也是這一點,這也是微軟選擇聯姻Hadoop的主要緣故。



[火星人 ] 「閉源」微軟擁抱開源Hadoop欲何為?已經有487次圍觀

http://coctec.com/news/soft/show-post-74323.html