• Hadoop與微軟 資訊

    想要通過微軟技術棧來嘗試 Hadoop,看看他們到底能帶來哪些功能么?我們這里列舉出一些對你有幫助的資源。

    fmms 2012-05-12   24516   1
    Hadoop  

    Hadoop VS Spark 資訊

    Hadoop就是解決了大數據(大到一臺計算機無法進行存儲,一臺計算機無法在要求的時間內進行處理)的可靠存儲和處理。 HDFS,在由普通PC組成的集群上提供高可靠的文件存儲,通過將塊保存多個副本的辦法解決服務器或硬盤壞掉的問題。

    jopen 2015-11-21   34595   0
    Hadoop  
    P11

      hadoop入門教程 文檔

    第一次搞hadoop,折騰我2天,功夫不負有心人,終于搞好了,現在來分享下,我的環境操作系統:wmv虛擬機中的ubuntu12.04hadoop版本:hadoop-1.0.4(聽說是穩定版就下了)eclipse版本:eclipse-jee-indigo-SR2-win321.先安裝好jdk,然后配置好jdk的環境變量,在這里我就不累贅了!網上多的是2.安裝ssh這個也不用說了

    peixy 2016-11-03   551   0
    P23

      Yahoo! Hadoop教程 文檔

    歡迎來到Yahoo!Hadoop教程!這個系列教程將向你介紹ApacheHadoop系統的許多方向,還將向你展示:如何進行簡單和高級的集群配置;如何使用分布式文件系統;如何使用分布式文件系統,如何開發復雜的HadoopMapReduce應用,并且其它相關的分布式系統也提及。

    huafenged 2011-08-17   4717   0

    Hadoop Sentry 學習 經驗

    Sentry 是Cloudera 公司發布的一個Hadoop開源組件,它提供細粒度基于角色的安全控制

    jopen 2014-08-16   32366   0

    基本hadoop文件操作 經驗

    基本hadoop文件操作

    y3c5 2015-05-11   11006   0

    Zookeeper 在Hadoop中的應用 經驗

    Zookeeper 分布式服務框架是 Apache Hadoop 的一個子項目,它主要是用來解決分布式應用中經常遇到的一些數據管理問題,如:統一命名服務、狀態同步服務、集群管理、分布式應用配置項的管理等。

    jopen 2015-06-24   24315   0

    hadoop調度算法 經驗

    1 hadoop目前支持以下三種調度器: FifoScheduler:最簡單的調度器,按照先進先出的方式處理應用。只有一個隊列可提交應用,所有用戶提交到這個隊列。沒有應用優先級可以配置。

    jopen 2016-01-03   10037   0
    P26

      Hadoop Performance at LinkedIn 文檔

    Hadoop Performance at LinkedIn

    b8gp 2014-10-10   2310   0
    P150

      Hadoop 介紹 文檔

    Hadoop是什么?一個分布式文件系統和并行執行環境;一個軟件集;讓用戶便捷地處理海量數據;Apache軟件基金會下面的一個開源項目;目前Yahoo!是最主要的貢獻者;Hadoop子項目Hadoop Common:在0.20及以前的版本中,包含HDFS、MapReduce和其他項目公共內容,從0.21開始HDFS和MapReduce被分離為獨立的子項目

    tony2007 2015-06-20   625   0
    P29

      Docker Based Hadoop Provisioning 文檔

    Thanks for coming – today will talk about Docker based Hadoop provisioning. Quick introduction of who we are - Young startup, from Budapest, Hungary. Janos Matyas – CTO, open source contributor, Hadoop YARN evangelist. Ease Hadoop provisioning – everywhere Automate and unify the process Arbitrary cluster size Same process through a cluster lifecycle (Dev, QA, UAT, Prod) (Auto) scaling Hadoop

    pwgw 2016-02-04   504   0
    P28

      Hadoop下MapReduce編程 文檔

    內容:MapReduce概述,MapReduce的數據流,檢查點,相關編程要點,Map過程Map過程通過在輸入列表中的每一項執行函數,生成一系列的輸出列表。Reduce過程Reduce過程在一個輸入的列表進行掃描工作,隨后生成一個聚集值,作為最后的輸出MapReduce的Reduce過程所有不同的顏色代表不同的鍵值(keys)。

    slayerlyy 2011-11-22   4450   0
    P26

      Hadoop實用指南 文檔

    Sogou的Hadoop生態系統 Hadoop Quick Start 深入MapReduce 了解MapReduce運行機制 如何調試MapReduce MultiInput & MultiOutput 數據Join操作 關于UigsTools MapReduce進階開發模式 各類資源列表

    yudian 2014-10-29   1898   0
    P18

      Hadoop 介紹 文檔

    Hadoop的簡介;Map Reduce介紹;Hadoop 執行步驟;Hadoop 的安裝和配置應用情景分析一、Hadoop的簡介hadoop是做什么的?Hadoop為云計算平臺提供了一種分布式存儲和并行計算的能力。將大塊的數據文件,如數據規模在G、T級別,進行切割并進行分布式存儲;hadoop的mapreduce計算模型,將計算任務按照分割文件拆解并進行分布式并行計算,后再對計算結果進行匯總。

    amen1024 2012-08-03   6077   0

    Hadoop中文文檔 博客

    Hadoop中文文檔 http://hadoop.apache.org/common/docs/r0.17.2/cn/

    whatot 2011-11-18   3816   0

    Hadoop是什么 博客

    Hadoop 原來是 Apache Lucene 下的一個子項目,它最初是從 Nutch 項目中分離出來的專門負責分布式存儲以及分布式運算的項目。簡單地說來, Hadoop 是一個可以更容易開發和運行處理大規模數據的軟件平臺。下面列舉 hadoop 主要的一些特點: 擴容能力( Scalable ) :能可靠地( reliably )存儲和處理千兆字節( PB )數據。 成本低( Economic

    jopen 2012-02-01   1098   0
    lamp  
    P24

      Apache Hadoop介紹 文檔

    Apache Hadoop是一個用java語言實現的軟件框架,在由大量計算機組成的集群中運行海量數據的分布式計算,它可以讓應用程序支持上千個節點和PB級別的數據。Hadoop的核心子項目,提供了一個分布式文件系統(HDFS)和支持MapReduce的分布式計算。

    觀光閣 2011-05-15   17718   0

    Nutch Hadoop 教程 博客

    怎樣安裝Nutch和 Hadoop 搜尋網頁和郵件列表,似乎很少有關于如何使用Hadoop (曾經的DNFS)分布式文件系統( HDFS )和MapReduce來安裝Nutch的文章 。 本教程的目的是通過逐步講解的方法,來講解了如何在多節點的Hadoop文件系統上運行Nutch,包括能夠同時索引(爬取)和搜尋多臺機器。 這篇文檔沒有涉及到Nutch或Hadoop架構。它只是講述了如何讓系統啟動和

    Hadoopp 2012-09-28   6548   0
    屌絲  

    Hadoop生態圖譜 博客

    當下Hadoop已經成長為一個龐大的體系,貌似只要和海量數據相關的,沒有哪個領域缺少Hadoop的身影,下面是一個Hadoop生態系統的圖譜,詳細的列舉了在Hadoop這個生態系統中出現的各種數據工具。 這一切,都起源自Web數據爆炸時代的來臨 數據抓取系統 - Nutch 海量數據怎么存,當然是用分布式文件系統 - HDFS 數據怎么用呢,分析,處理 MapReduce框架,讓你編寫代碼來實現對

    ppucd 2012-10-12   1495   0
    lamp  
    P23

      Yahoo的Hadoop教程 文檔

    歡迎來到Yahoo! Hadoop教程!這個系列教程將向你介紹Apache Hadoop系統的許多方向,還將向你展示:如何進行簡單和高級的集群配置;如何使用分布式文件系統;如何使用分布式文件系統,如何開發復雜的Hadoop MapReduce應用,并且其它相關的分布式系統也提及。Hadoop是一個大規模分布式批處理架構,雖然它在單臺計算機上也能使用,但它的真正能力是在成百上千計算機上運行時才顯現出來,Hadoop可以高效地將大量工作高效地分布到一組計算機上。

    linyouzhu 2012-05-31   6122   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色