• P

    Hadoop 1.2.1 API 文檔 文檔

    Hadoop 是一個能夠對大量數據進行分布式處理的軟件框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop 是可靠的,因為它假設計算元素和存儲會失敗,因此它維護多個工作數據副本,確保能夠針對失敗的節點重新分布處理。Hadoop 是高效的,因為它以并行的方式工作,通過并行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。此外,Hadoop 依賴于社區服務器,因此它的成本比較低,任何人都可以使用。

    allen789 2013-10-31   7446   0
    P

    Hadoop 入門手冊 文檔

    MapReduce編程模型的思想來源于函數式編程語言Lisp,由Google公司于2004年提出并首先應用于大型集群。同時,Google也發表了GFS、BigTable等底層系統以應用MapReduce模型。在2007年,Google’s MapReduce Programming Model-Revisted論文發表,進一步詳細介紹了Google MapReduce模型以及Sazwall并行處理海量數據分析語言。Google公司以MapReduce作為基石,逐步發展成為全球互聯網企業的領頭羊。 <br> Hadoop作為Apache基金會資助的開源項目,由Doug Cutting帶領的團隊進行開發,基于Lucene和Nutch等開源項目,實現了Google的GFS和Hadoop能夠穩定運行在20個節點的集群;2006年1月,Doug Cutting加入雅虎公司,同年2月Apache Hadoop項目正式支持HDFS和MapReduce的獨立開發。同時,新興公司Cloudera為Hadoop提供了商業支持,幫助企業實現標準化安裝,并志愿貢獻社區。Hadoop的最新版本是0.21.0,說明其還在不斷完善發展之中。

    030472875ken 2012-01-19   5752   0
    P11

      Hadoop 安裝手冊 文檔

    ? 概要設計 HADOOP安裝手冊 v0.1 Date Version Description Author 2011-7-18 0.1 Initial 楊哲 Page of 11 概要設計 目錄 Page

    ccvcd 2014-04-10   394   0
    P133

      Hadoop快速入門 文檔

    ?Hadoop快速入門 · 目的 · 先決條件 o 支持平臺 o 所需軟件 o 安裝軟件 · 下載 · 運行Hadoop集群的準備工作 · 單機模式的操作方法 · 偽分布式模式的操作方法 o 配置 o

    beanshell 2011-07-16   599   0

    Spark與Hadoop之間的PK 資訊

    一說大數據,人們往往想到 Hadoop。這固然不錯,但隨著大數據技術的深入應用,多種類型的數據應用不斷被要求提出,一些 Hadoop 被關注的范疇開始被人們注意,相關技術也迅速獲得專業技術范疇的應用。最近半年來的

    jopen 2014-12-05   15510   0
    Spark  
    P6

      Hadoop 集群配置 文檔

    ?Hadoop集群 在linux下配置 第一部分 Hadoop 1.2.1 下載 Hadoop我們從Apache官方網站直接下載最新版本Hadoop1.2.1。 下載地址:http://apache.fayea

    yangzhp1_1 2013-12-17   2695   0
    P14

      hadoop,hbase安裝步驟 文檔

    ?Hadoop,ZooKeeper,HBase,hive(HQL) 安裝步驟 Hadoop安裝: 首先我們統一一下定義,在這里所提到的Hadoop是指Hadoop Common,主要提供DFS(分布式

    xnbw 2016-01-11   2200   0
    P31

      The hadoop Fair Scheduler 文檔

    1. The Hadoop Fair SchedulerMatei Zaharia Cloudera / Facebook / UC BerkeleyUC Berkeley 2. OutlineMotivation

    hadoopfans 2010-11-20   3577   0
    P30

      Hadoop 入門指南 文檔

    1. Hadoop入門指南劉明珠 Cloud_dev 2. 什么是Hadoop如何使用HadoopHadoop的原理MapReduce進階開發模式各類資源列表提綱 3. Why Hadoop 數據規模

    yudian 2014-10-29   565   0
    P46

      云計算之Hadoop 文檔

    云計算之Hadoop報告人:趙輝 指導老師:楊樹強 2. 報告內容Hadoop核心 Hadoop dfs(Hdfs) MapReduce 分布式并行計算模型 Hadoop擴展 Hadoop base

    qiu.n@sand 2011-10-26   5538   0
    P61

      Hadoop分享 文檔

    1. Hadoop分享云計算概念 Google的云計算 Hadoop HDFS Map/Reduce 日志框架的Hadoop嘗試 路在何方 2. Linux公社(LinuxIDC.com)Linux公社(LinuxIDC

    jphnny 2016-06-28   640   0
    P32

      Hadoop學習總結 文檔

    1. Hadoop---------------分布式開發框架 2. 目錄 3. 數據紐約證券交易所每天產生1TB的交易數據 社交網站facebook的主機存儲著約10億張照片,占據PB級存儲空間 互

    lxj2008 2014-01-19   553   0
    P35

      Hadoop及Mapreduce入門 文檔

    1. Hadoop入門盧學裕@優酷網 2012.07 2. OutlinesHadoop Overview HDFS Map-reduce Programming Paradigm Hadoop Map-reduce

    lxz 2014-01-03   2919   0

    Hadoop + HBase + Solr = Lily 開源項目

    Lily是第一個基于云技術(Big Data與NOSQL)實現的開源數據和內容倉庫。它用到的具體技術包括: Hadoop, HBase和Solr。可應用于構建:網絡硬盤系統,大型SaaS模式的Web內容管理系統,文

    碼頭工人 2019-01-17   1174   0
    P150

      Hadoop 介紹 文檔

    1. Hadoop入門aokinglinux@hotmail.com 2. hadoop(1)Google (2)Hadoop (3)HDFS (4)MapReduce (5)Cloudera (6)Hadoop的使用

    pnx8 2014-08-17   388   0

    Hadoop編程入門 博客

    net/calvinxiu/archive/2007/02/09/1506112.aspx Hadoop 是Google MapReduce 的 一個Java 實現。MapReduce是一種簡化的分

    Hadoopp 2012-09-28   1276   0
    NeoLua  
    P10

      Hadoop 集群測試報告 文檔

    ? Hadoop集群測試報告 1.測試環境 硬件環境 軟件環境 o RHEL6.2 2.6.32-220.el6.x86_64 o hadoop-1.0.2 o hive-0.8.1 o hbase-0

    lenhan12345 2012-11-27   7980   0
    P3

      廣告商采用 Hadoop 文檔

    ?廣告商采用 Hadoop 借助 Apache Hadoop 進行可靠的宣傳和促銷 消費者從未在自己如何搜索、討論和購買產品上生成如此多的 數據。這種新數據對于品牌或產品的塑造和推廣非常重要,但是并未

    tony2007 2015-06-20   8022   0
    P

    Hadoop 1.2.1 API 規范 文檔

    Hadoop是一個分布式的計算平臺。 Hadoop primarily consists of the Hadoop Distributed FileSystem (HDFS) and an implementation of the Map-Reduce programming paradigm.<br> Hadoop is a software framework that lets one easily write and run applications that process vast amounts of data. Here's what makes Hadoop especially useful:<br> 可擴展: Hadoop can reliably store and process petabytes. 廉價: It distributes the data and processing across clusters of commonly available computers. These clusters can number into the thousands of nodes. <br> 高效: By distributing the data, Hadoop can process it in parallel on the nodes where the data is located. This makes it extremely rapid. <br> 可靠: Hadoop automatically maintains multiple copies of data and automatically redeploys computing tasks based on failures.

    mingmingok 2014-05-27   5722   0
    P

    Apache Hadoop Main 2.2.0 API 文檔

    Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。HDFS有高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統中的數據。 Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS為海量的數據提供了存儲,則MapReduce為海量的數據提供了計算

    colophus 2014-11-13   434   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色