• 基于Hadoop MapReduce模型的數據分析平臺研究設計 經驗

    原文 http://www.36dsj.com/archives/28713 前言 拖了5天終于看完了兩篇論文,對相關數據分析平臺搭建技術也有了進一步的了解。對自己這幾天的筆記做了一個整理,既

    d3fw 2015-04-28   48832   0

    大數據賽道上的單挑:MapReduce與Spark到底誰快? 資訊

    原文 http://www.ctocio.com/ccnews/19303.html 通常人們認為Spark的性能和速度全面優于MapReduce,但最新的對決顯示MapReduce在某些方面也有勝場,而且數據規模越大優勢越大。

    jopen 2015-10-11   12292   0

    Ubuntu上Hadoop Mapreduce集群搭建以及程序運行 經驗

    為了完成計算機綜合實驗的考核,折騰了三天,終于完成了在Hadoop集群上完成了Mapreduce的實驗。但是,后面的考試接踵而至,也就沒能及時寫下心得,考試結束了。趕緊把過程中的步驟和遇到的困難記錄下

    jopen 2013-01-20   22851   0

    Hadoop MapReduce下一代 - 命令行Mini集群 經驗

    op集群,不需要設置任何環境變量和管理配置文件。這個CLI Mini集群將會啟動Yarn/MapReduce和HDFS。 這個案例適合想要快速體驗一個真實的Hadoop集群或者測試一個沒有java程序的功能。

    jopen 2014-10-31   13426   0

    MapReduce-Hadoop分布式計算模型 經驗

    MapReduce概述 MapReduce是一種分布式計算模型,由Google提出,主要用于搜索領域,解決海量數據的計算問題。 MR由兩個階段組成:Map和Reduce,用戶只需要實現map(

    nbd2 2015-07-14   38345   0

    不同的瑞士軍刀:對比 Spark 和 MapReduce 經驗

    再次引爆了大數據的話題。帶著比 Hadoop MapReduce 速度要快 100 倍的承諾以及更加靈活方便的 API,一些人認為這或許預示著 Hadoop MapReduce 的終結。 作為一個開源的數據處理框架,Spark

    jopen 2016-01-14   21447   0

    MapReduce 圖解流程超詳細解答(2)-【map階段】 經驗

    )。緩沖區的大小是固定的,通過 mapreduce.task.io.sort.mb (default: 100MB)指定。 任何時候當這個緩沖區將要充滿的時候( mapreduce.map. sort.spill

    jopen 2016-01-18   9868   0

    Storm、Spark和MapReduce 開源分布式計算系統框架比較 資訊

    Streaming 分布式計算在許多領域都有廣泛需求,目前流行的分布式計算框架主要有 Hadoop MapReduce, Spark Streaming, Storm; 這三個框架各有優勢,現在都屬于 Apache

    jopen 2015-10-15   16466   1
    Spark  

    MapReduce 圖解流程超詳細解答(1)-【map階段】 經驗

    MapReduce中,一個YARN 應用被稱作一個job, MapReduce 框架提供的應用,master的一個實現被稱作 MRAppMaster MapReduce Job的時間線

    jopen 2016-01-18   38600   0
    P39

      Hadoop MapReduce 模塊源代碼詳細解析 文檔

    作者是在讀了“覺先”的博客《Hadoop學習總結之四:Map-Reduce的過程解析》之后才從宏觀上了解Hadoop MapReduce模塊的工作原理,并且以此為藍本,寫出了本文。所以,首先在此向“覺先”表示敬意。另外本文當中可

    songyl525 2013-12-11   465   0

    雅虎架構師談MapReduce和Hadoop的未來 博客

    Scott Delap 譯者 Terry Hadoop 是一個開源的分布式計算平臺,它主要由MapReduce的算法執行和一個分布式 的文件系統等兩部分組成。InfoQ曾經 刊登過 一 篇Jeremy

    Hadoopp 2012-09-28   840   0

    五種基于 MapReduce 的并行計算框架介紹及性能測試 經驗

    理的方式。 2003 年美國 Google 公司對外發布了 MapReduce、GFS、BigData 三篇論文,至此正式將并行計算框架落地為 MapReduce 框架。 我國的并行和分布式計算技術研究起源于

    jopen 2015-07-15   71471   0

    基于MapReduce開發的數據挖掘/機器學習庫 - Mahout 經驗

    易于使用 Apache Mahout是什么 基于MapReduce開發的數據挖掘/機器學習庫 良好的擴展性和容錯性 充分利用了MapReduce和HDFS的擴展性和容錯性 屬于Hadoop生態系統重要組成部分

    jopen 2016-01-20   17099   0

    MapReduce 到 Hive —— 一次遷移過程小記 經驗

    當側重關心與業務相關的內容的時候,用hive會比較有優勢。而在一些性能要求高,算法研究的時候,mr會更加適合。 原文地址: http://rdc.taobao.org/?p=1457

    jopen 2014-01-10   32500   0

    MapReduce初探之一基于Mongodb實現標簽統計 經驗

    MapReduce 是一種編程模型,是 Google 提出的一種軟件架構,主要應用于分布式系統上。Google對其原始的定義是 “ MapReduce is a framework for computing

    jopen 2013-03-06   18148   0

    Python版的一個計算好友相似度的MapReduce實現 經驗

    示計算共同好友的兩名用戶添加的最小好友數。經測算,大概每名用戶需要5s的計算時間。 而MapReduce就是把原來一步能完成的工作切成了三步,mapper -> sort -> reducer。其

    jopen 2013-05-09   21292   0

    MapReduce編程模型的一個輕量級實現:Mrs 經驗

    Mrs是MapReduce編程模型的一個輕量級實現,但同樣擁有高性能,可用于并行計算。它專門為計算密集型程序優化,特別是那些擁有迭代的程序。它的目標是可以簡單的安裝和使用。Mrs采用 Python 開發,支持Python

    jopen 2012-09-21   18312   0
    P31

      第三章:MapReduce 分布式計算系統 文檔

    ?第3章:MapReduce—分布式計算系統 3.1. MapReduce是什么? Python中的map和reduce 如果我們把MapReduce拆開看,就是兩個單詞map和reduce。在本書中

    beat_it 2013-11-16   1837   0
    P81

      Hadoop練習 - MapReduce 進行數據查詢和實現推簡單薦系統 文檔

    ?Hadoop練習—MapReduce進行數據查詢和實現推簡單薦系統 1??運行環境說明 1.1?硬軟件環境 1.2?機器網絡環境 2??書面作業1:計算員工相關 2.1?書面作業1內容 2.2??實現過程

    whongji 2015-06-02   3286   0
    P8

      HDFS+MapReduce+Hive十分鐘快速入門 文檔

    ?HDFS+MapReduce+Hive十分鐘快速入門 HDFS+MapReduce+Hive十分鐘快速入門 一見 2009-8-19 1. 前言 本文的目的是讓一個從未接觸Hadoop的人,在很短的

    xnbw 2016-01-12   418   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色