Hadoop生態圖譜

ppucd 12年前發布 | 1K 次閱讀 lamp

當下Hadoop已經成長為一個龐大的體系,貌似只要和海量數據相關的,沒有哪個領域缺少Hadoop的身影,下面是一個Hadoop生態系統的圖譜,詳細的列舉了在Hadoop這個生態系統中出現的各種數據工具。

  1. 這一切,都起源自Web數據爆炸時代的來臨
  2. 數據抓取系統 - Nutch
  3. 海量數據怎么存,當然是用分布式文件系統 - HDFS
  4. 數據怎么用呢,分析,處理
  5. MapReduce框架,讓你編寫代碼來實現對大數據的分析工作
  6. 非結構化數據(日志)收集處理 - fuse,webdav, chukwa, flume, Scribe
  7. 數據導入到HDFS中,至此RDBSM也可以加入HDFS的狂歡了 - Hiho, sqoop
  8. MapReduce太麻煩,好吧,讓你用熟悉的方式來操作Hadoop里的數據 – Pig, Hive, Jaql
  9. 讓你的數據可見 - drilldown, Intellicus
  10. 用高級語言管理你的任務流 – oozie, Cascading
  11. Hadoop當然也有自己的監控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia
  12. 數據序列化處理與任務調度 – Avro, Zookeeper
  13. 更多構建在Hadoop上層的服務 – Mahout, Elastic map Reduce
  14. OLTP存儲系統 – Hbase

 本文由用戶 ppucd 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!