• Hadoop的Jython封裝 Happy 經驗

    Hadoop + Python = Happy Happy 為Jython開發者使用Hadoop框架提供了便利,Happy框架封裝了Hadoop的復雜調用過程,讓Map-Reduce開發變得更為容

    openkk 2012-06-08   16928   0

    Spark與Hadoop的結合 經驗

    point。 RDD的不變性,可以實現類Hadoop MapReduce的推測式執行。 RDD的數據分區特性,可以通過數據的本地性來提高性能,這與Hadoop MapReduce是一樣的。 RDD都是

    jopen 2014-09-23   100810   0

    Hadoop 集群常見錯誤 經驗

    這里將自己在初識hadoop過程中遇到的一些錯誤做一個簡單總結: (一)啟動 hadoop 集群時易出現的錯誤: 1. 錯誤現象: java.net.NoRouteToHostException:

    openkk 2012-03-05   99244   0
    P129

      Hadoop 從入門到精通 文檔

    ?超人Hadoop網絡學習社區—http://bbs.superwu.cn|吳超.沉思錄 第1章:環境準備 1.1.VirtualBox的安裝 VirtualBox簡介 VirtualBox號稱是免費

    beat_it 2013-11-16   525   0
    P41

      Hadoop Map/Reduce教程 文檔

    http://user.qzone.qq.com/165162897/blog/1257776641 Hadoop Map/Reduce教程[一] 編輯 | 刪除 | 權限設置 | 更多▼ 更多▲ · 設置置頂

    Tonywang 2011-08-08   5052   0
    P

    Hadoop入門手冊 文檔

    MapReduce編程模型的思想來源于函數式編程語言Lisp,由Google公司于2004年提出并首先應用于大型集群。同時,Google也發表了GFS、BigTable等底層系統以應用MapReduce模型。在2007年,Google’s MapReduce Programming Model-Revisted論文發表,進一步詳細介紹了Google MapReduce模型以及Sazwall并行處理海量數據分析語言。Google公司以MapReduce作為基石,逐步發展成為全球互聯網企業的領頭羊。Hadoop作為Apache基金會資助的開源項目,由Doug Cutting帶領的團隊進行開發,基于Lucene和Nutch等開源項目,實現了Google的GFS和Hadoop能夠穩定運行在20個節點的集群;2006年1月,Doug Cutting加入雅虎公司,同年2月Apache Hadoop項目正式支持HDFS和MapReduce的獨立開發。同時,新興公司Cloudera為Hadoop提供了商業支持,幫助企業實現標準化安裝,并志愿貢獻社區。Hadoop的最新版本是0.21.0,說明其還在不斷完善發展之中。

    gopen 2011-10-20   1001   0
    P

    Hadoop 0.20.203.0 API 文檔

    Hadoop是一個分布式系統基礎架構,由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力高速運算和存儲。簡單地說來,Hadoop是一個可以更容易開發和運行處理大規模數據的軟件平臺。 Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。HDFS有著高容錯性(fault-tolerent)的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streaming access)文件系統中的數據。

    perfectqgw 2012-11-18   3212   0
    P

    Hadoop 0.20.1 API 文檔

    Hadoop是一個分布式系統基礎架構,由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力高速運算和存儲。簡單地說來,Hadoop是一個可以更容易開發和運行處理大規模數據的軟件平臺。Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。HDFS有著高容錯性(fault-tolerent)的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streaming access)文件系統中的數據。

    wanjia19 2011-08-10   6182   0
    P3

      Hadoop任務調度 文檔

    ?Hadoop任務調度 在Master上運行的是JobTracker守護進程,而在Slave上運行的是TaskTracker守護進程。對于一個作業,首先提交給JobTracker,再由JobTracker對提交的作業進行處理。

    thinkingx 2011-12-15   5872   0
    P2

      Hadoop API組成 文檔

    ?Hadoop API組成 Hadoop API被分成(divide into)如下幾種主要的包(package) 序號 名稱 說明 1. org.apache.hadoop.conf 定義了系統參數的配置文件處理API。

    willfly 2011-08-28   4194   0
    P7

      Hadoop 命令大全 文檔

    所有的Hadoop命令均由bin/hadoop腳本引發。不指定參數運行hadoop腳本會打印所有命令的描述。 The general command line syntax is: hadoop [--config

    xfj3526 2012-06-13   3684   0
    P41

      Hadoop Map/Reduce教程 文檔

    ?Hadoop Map/Reduce教程[一] 編輯 | 刪除 | 權限設置 | 更多▼ 更多▲ · 設置置頂 · 推薦日志 · 轉為私密日志 開心延年 ?? 發表于2009年11月02日 00:15

    wentao 2012-02-03   2837   0
    P50

      Hadoop 實戰手冊 文檔

    科技改變生活! 思數科技集群部署入門 修訂記錄 日期 修改原因 描述 作者 2012/02/14 初稿 Hadoop部署文檔 2012/07/14 完善細節 新基礎環境配置,修改配置文件,修改架構圖。 2012/07/16

    ka520 2015-11-14   434   0

    Hadoop Streaming使用簡介 經驗

    一、Hadoop Streaming 它是hadoop的一個工具,用來創建和運行一類特殊的map/reduce作業。所謂的特殊的map/reduce作業可以是可執行文件或腳本本件(python、P

    jopen 2011-12-21   55545   0

    Hadoop命令手冊 博客

    概述 所有的hadoop命令均由bin/hadoop腳本引發。不指定參數運行hadoop腳本會打印所有命令的描述。 用法:hadoop [--config confdir] [COMMAND]

    jopen 2012-02-01   4317   0
    P27

      Hadoop 分享 文檔

    發現異常 MapReduce 參與 計算角色 窺探 JOB 運行 MR 提供重寫 接口 配置參數調優 Hadoop 組成 3. HDFS 文件系統 4. HDFS 什么是文件系統 文件系統:操作系統用于明確磁盤或分區上的文件的方法和數據結構;

    gppxm 2012-10-19   2076   0
    P35

      Hadoop及mapreduce入門 文檔

    1. Hadoop入門盧學裕@優酷網 2012.07 2. OutlinesHadoop Overview HDFS Map-reduce Programming Paradigm Hadoop Map-reduce

    P49

      Hadoop Technical Introduction 文檔

    1. Lecture 11 – Hadoop Technical Introduction 2. TerminologyGoogle calls it:Hadoop equivalent:MapRed

    Eric_V72 2013-10-20   347   0

    Hadoop 排重優化 經驗

    如果覺得有幫助的話就頂下吧 在統計的時候經常會用到排重,比如想統計每日登陸用戶,但是一個用戶一次多次登陸情況,或者一個產品被多少個用戶下載。。

    ygp8 2015-09-05   6606   0

    Hadoop 入門實踐 經驗

    im/2016/03/05/hadoop-101/ Hadoop 2.0 架構 Hadoop 包括如下幾個模塊: Hadoop Common:公共基礎組件; Hadoop Distributed File

    1 2 3 4 5 6 7 8 9 10
  • sesese色