• P32

      Hadoop 學習總結 文檔

    1. Hadoop---------------分布式開發框架 2. 目錄 3. 數據紐約證券交易所每天產生1TB的交易數據 社交網站facebook的主機存儲著約10億張照片,占據PB級存儲空間 互

    orangeking 2012-06-29   8911   0
    P36

      Hadoop / MapReduce 討論與學習 文檔

    1. Hadoop / MapReduce 討論與學習 2. Hadoop 源起Apache Lucene 開源的高性能全文檢索工具包 Apache Nutch 開源的 Web 搜索引擎 Google

    jphnny 2016-06-28   3381   0
    P38

      Hadoop 介紹 - API 文檔

    1. Hadoop 電子工業出版社 劉鵬主編《云計算》教材配套課件8 2. 主要內容Hadoop項目簡介 HDFS體系結構 HDFS關鍵運行機制 Hadoop VS.Google(分布式文件系統) Hadoop

    zoujl 2012-08-29   4332   0
    P38

      Hadoop 技術講解 文檔

    1. Hadoop 電子工業出版社 劉鵬主編《云計算》教材配套課件8 2. 主要內容Hadoop項目簡介 HDFS體系結構 HDFS關鍵運行機制 Hadoop VS.Google(分布式文件系統) Hadoop

    aaron509 2012-03-01   4567   0

    Hadoop安裝指南 博客

    支持平臺 GNU/Linux是產品開發和運行的平臺。 Hadoop已在有2000個節點的GNU/Linux主機組成的集群系統上得到驗證。 Win32平臺是作為 開發平臺 支持的。由于分布式操作尚未在W

    jopen 2012-09-06   2803   0
    jeecg  

    Hadoop的Python封裝 Dumbo 經驗

    fm發布了基于Python的Dumbo(小 飛象)項目,Dumbo能夠幫助Python開發者更方便的編寫Hadoop應用,并且Dumbo為MapReduce應用提供了靈活易用的Python API。Last.f

    openkk 2012-06-08   30083   0

    Hadoop java操作HDFS 經驗

    hfds 是一種文件系統,用于存儲hadoop將要處理的數據。適用于大規模分布式數據處理,是一個 可擴展行的文件分布式系統; 優點 1、如果出現節點宕機,hdfs,可以持續監視,錯誤檢查,容錯處理,文檔恢復

    jopen 2013-08-16   49709   0
    P46

      云計算之Hadoop 文檔

    云計算之Hadoop報告人:趙輝 指導老師:楊樹強 2. 報告內容Hadoop核心 Hadoop dfs(Hdfs) MapReduce 分布式并行計算模型 Hadoop擴展 Hadoop base

    huafenged 2011-08-17   4776   0
    P38

      Hadoop 技術講解 文檔

    1. Hadoop 電子工業出版社 劉鵬主編《云計算》教材配套課件8 2. 主要內容Hadoop項目簡介 HDFS體系結構 HDFS關鍵運行機制 Hadoop VS.Google(分布式文件系統) Hadoop

    xiexiantao 2012-06-20   2317   0
    P38

      Hadoop項目簡介 文檔

    1. Hadoop 電子工業出版社 劉鵬主編《云計算》教材配套課件8 2. 主要內容Hadoop項目簡介 HDFS體系結構 HDFS關鍵運行機制 Hadoop VS.Google(分布式文件系統) Hadoop

    451237450 2011-11-10   4302   0
    P38

      Hadoop 技術講解 文檔

    1. Hadoop 電子工業出版社 劉鵬主編《云計算》教材配套課件8 2. 主要內容Hadoop項目簡介 HDFS體系結構 HDFS關鍵運行機制 Hadoop VS.Google(分布式文件系統) Hadoop

    ning042712 2012-12-03   498   0
    P46

      云計算之Hadoop 文檔

    云計算之Hadoop報告人:趙輝 指導老師:楊樹強 2. 報告內容Hadoop核心 Hadoop dfs(Hdfs) MapReduce 分布式并行計算模型 Hadoop擴展 Hadoop base

    daibiao 2012-06-13   5056   0

    Hadoop的Jython封裝 Happy 經驗

    Hadoop + Python = Happy Happy 為Jython開發者使用Hadoop框架提供了便利,Happy框架封裝了Hadoop的復雜調用過程,讓Map-Reduce開發變得更為容

    openkk 2012-06-08   16928   0

    Spark與Hadoop的結合 經驗

    point。 RDD的不變性,可以實現類Hadoop MapReduce的推測式執行。 RDD的數據分區特性,可以通過數據的本地性來提高性能,這與Hadoop MapReduce是一樣的。 RDD都是

    jopen 2014-09-23   100810   0

    Hadoop 集群常見錯誤 經驗

    這里將自己在初識hadoop過程中遇到的一些錯誤做一個簡單總結: (一)啟動 hadoop 集群時易出現的錯誤: 1. 錯誤現象: java.net.NoRouteToHostException:

    openkk 2012-03-05   99244   0
    P129

      Hadoop 從入門到精通 文檔

    ?超人Hadoop網絡學習社區—http://bbs.superwu.cn|吳超.沉思錄 第1章:環境準備 1.1.VirtualBox的安裝 VirtualBox簡介 VirtualBox號稱是免費

    beat_it 2013-11-16   525   0
    P41

      Hadoop Map/Reduce教程 文檔

    http://user.qzone.qq.com/165162897/blog/1257776641 Hadoop Map/Reduce教程[一] 編輯 | 刪除 | 權限設置 | 更多▼ 更多▲ · 設置置頂

    Tonywang 2011-08-08   5052   0
    P

    Hadoop入門手冊 文檔

    MapReduce編程模型的思想來源于函數式編程語言Lisp,由Google公司于2004年提出并首先應用于大型集群。同時,Google也發表了GFS、BigTable等底層系統以應用MapReduce模型。在2007年,Google’s MapReduce Programming Model-Revisted論文發表,進一步詳細介紹了Google MapReduce模型以及Sazwall并行處理海量數據分析語言。Google公司以MapReduce作為基石,逐步發展成為全球互聯網企業的領頭羊。Hadoop作為Apache基金會資助的開源項目,由Doug Cutting帶領的團隊進行開發,基于Lucene和Nutch等開源項目,實現了Google的GFS和Hadoop能夠穩定運行在20個節點的集群;2006年1月,Doug Cutting加入雅虎公司,同年2月Apache Hadoop項目正式支持HDFS和MapReduce的獨立開發。同時,新興公司Cloudera為Hadoop提供了商業支持,幫助企業實現標準化安裝,并志愿貢獻社區。Hadoop的最新版本是0.21.0,說明其還在不斷完善發展之中。

    gopen 2011-10-20   1001   0
    P

    Hadoop 0.20.203.0 API 文檔

    Hadoop是一個分布式系統基礎架構,由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力高速運算和存儲。簡單地說來,Hadoop是一個可以更容易開發和運行處理大規模數據的軟件平臺。 Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。HDFS有著高容錯性(fault-tolerent)的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streaming access)文件系統中的數據。

    perfectqgw 2012-11-18   3212   0
    P

    Hadoop 0.20.1 API 文檔

    Hadoop是一個分布式系統基礎架構,由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力高速運算和存儲。簡單地說來,Hadoop是一個可以更容易開發和運行處理大規模數據的軟件平臺。Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。HDFS有著高容錯性(fault-tolerent)的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streaming access)文件系統中的數據。

    wanjia19 2011-08-10   6182   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色