開源項目,開源代碼,開源文檔,開源新聞,開源社區

和大數據應用的爆發式增長，很多人正在尋找將他們已有的實現轉為 MapReduce 方式的方法。不幸的是，除了《應用 MapReduce 進行數據密集的文本處理》和《Mahout in Action》

openkk 2012-02-15 17978 0

MapReduce

putFormat的時候，竟然報錯，原因是必須繼承子org.apache.hadoop. mapreduce .OutputFormat。0.20.2比較致命的其中一個bug，升級到0.21能解決

openkk 2012-02-25 53272 0

MapReduce 分布式/云計算/大數據

MapReduce是google提出的一個軟件架構，是一種處理海量數據的并行編程模式，用于大規模數據集（通常大于1TB）的并行運算。 MapReduce封裝了并行處理，容錯處理，本地化計算，負載均

jopen 2014-03-15 24199 0

MapReduce 分布式/云計算/大數據

的分布式計算的計算模型，比較著名的就是MapReduce、MPI、BSP等。后來也產生了一些分布式計算系統，大家耳熟能詳的Hadoop就是基于 MapReduce實現的。本文的主人公是Parameter

jopen 2015-07-13 24082 0

MapReduce 分布式/云計算/大數據

摘要： Hadoop使用了MapReduce編程范式，目前已經被公認為是分布式環境中分析大數據的標準框架。然而，它并不能很好的應用于大規模的計算幾何處理。本文介紹的CG_Hadoop是一套可伸縮的和高效的

jopen 2016-01-05 23913 0

分布式/云計算/大數據

oschina.net/wdfnst/GraphMapReduce GraphMapReduce: 基于MapReduce編程模型的圖計算框架 (名詞約束: 頂點Vertex-圖中頂點;節點Process-計算單元節點)

Hop36R 2016-02-01 18910 0

MapReduce 圖計算 Git 分布式/云計算/大數據

再次引爆了大數據的話題。帶著比 Hadoop MapReduce 速度要快 100 倍的承諾以及更加靈活方便的 API，一些人認為這或許預示著 Hadoop MapReduce 的終結。作為一個開源的數據處理框架，Spark

jopen 2016-02-19 29104 0

MapReduce Spark

oTemplate().getCollection("userVisitRecord").mapReduce(map,reduce,"tmp",null); ????????DBCollection?

jopen 2015-06-17 5692 0

MongoDB

這里主要使用Java自帶郵件類實現Mapreduce任務的監控，如果 Mapreduce任務報錯則發送報錯郵件。Mapreduce的報錯信息通過hdfs中的日志獲取，里面的報錯日志是json格式，這里先將json轉

jopen 2015-08-18 2257 0

MapReduce

并且設置setFilterIfMissing為true，也就是設置為如果該列不存在就過濾掉這條數據，默認為false。 4.利用MapReduce導出hbase數據如果hbase作為數據的輸出，job設置如下： Configuration

jopen 2013-12-05 55572 0

HBase MapReduce NoSQL數據庫

應用程序通常會通過提供map和reduce來實現 Mapper和Reducer接口，它們組成作業的核心。

openkk 2012-05-18 36030 0

Hadoop 分布式/云計算/大數據

1.比如我們輸出的mapreduce結果，需要進入下一個mapreduce，該怎么解決？可以使用迭代式 2.那么什么是迭代式? 3.什么是依賴式？ 4.什么是鏈式？ 5.三種模式各自的應用場景是什么？

jopen 2014-11-12 16014 0

MapReduce 分布式/云計算/大數據

http://www.aboutyun.com/thread-8927-1-1.html Mapreduce在hadoop中是一個比較難以的概念。下面需要用心看，然后自己就能總結出來了。概括：

jopen 2016-01-18 18332 0

分布式/云計算/大數據

P16

?MapReduce:超大機群上的簡單數據處理 ? ????????????????????????????????????????? 摘要 MapReduce是一個編程模型,和處理,產生大數據集的相關實現

ljp123456 2014-03-22 304 0

分布式/云計算/大數據

原文出處：蘑菇先生 MapReduce近幾年比較熱的分布式計算編程模型，以C#為例簡單介紹下MapReduce分布式計算。閱讀目錄背景 Map實現 Reduce實現支持分布式總結

fff8 2015-05-26 15964 0

MapReduce .NET開發

這篇文章討論了 MapReduce design patterns的四種基本設計模式： 1. Input-Map-Reduce-Output 2. Input-Map-Output 3. Input-Multiple

langbo213 2016-10-12 10142 0

設計模式 MapReduce

Disco是一個基于MapReduce的分布式計算框架。Disco是一個開源項目，由諾基亞研究中心開發用來解決處理大數據時碰到的實際問題。 Disco采用Python開發，具有易于使用，強大的特點

openkk 2012-06-08 32597 0

MapReduce 存儲系統分布式/云計算/大數據

從這其中，我們想要計算出現的不同值的個數。可以用下列MR任務輕松完成這個工作: > db.runCommand( { mapreduce: "uniques", map: function () { emit(this.dim0

jopen 2013-11-01 33424 0

MongoDB NoSQL數據庫

P19

?MapReduce 超大集群的簡單數據處理收件人：發件人：崮山路上走9遍抄送：日期： 2005-08-05 關于： MapReduce: Simplified Data Processing

f0xf0x 2013-11-21 2001 0

分布式/云計算/大數據

本文將介紹基于物品的協同過濾推薦算法案例在TDW Spark與MapReudce上的實現對比，相比于MapReduce，TDW Spark執行時間減少了66%，計算成本降低了40%。本文將介紹基于物品的協同過濾推薦算法案例在TDW

jopen 2014-11-05 17978 0

Spark

MapReduce模式、算法和用例資訊

MapReduce程序reduce輸出控制經驗

分布式數據處理MapReduce 經驗

MapReduce的替代者-Parameter Server 經驗

CG_Hadoop：基于MapReduce的計算幾何經驗

基于MapReduce編程模型的圖計算框架經驗

Spark 是否真的比 MapReduce 技高一籌資訊

mongodb 通過MapReduce統計用戶Pv Uv 代碼段

Mapreduce任務實現郵件監控代碼段

HBase常用功能和HBase+MapReduce使用總結經驗

hadoop mapreduce核心功能描述經驗

MapReduce的組合式，迭代式，鏈式經驗

MapReduce中combine、partition、shuffle的作用是什么經驗

MapReduce 超大機群上的簡單數據處理文檔

探索C#之微型MapReduce 經驗

MapReduce 四種基本設計模式經驗

Disco - 基于MapReduce的分布式計算框架經驗

如何將 MongoDB MapReduce 速度提升 20 倍經驗

MapReduce超大集群的簡單數據處理文檔

Spark vs. MapReduce 時間節約66%，計算節約40% 資訊

Google MapReduce原文的相關搜索

關鍵詞

MapReduce模式、算法和用例 資訊

MapReduce程序reduce輸出控制 經驗

分布式數據處理MapReduce 經驗

MapReduce的替代者-Parameter Server 經驗

CG_Hadoop：基于MapReduce的計算幾何 經驗

基于MapReduce編程模型的圖計算框架 經驗

Spark 是否真的比 MapReduce 技高一籌 資訊

mongodb 通過MapReduce統計用戶Pv Uv 代碼段

Mapreduce任務實現郵件監控 代碼段

HBase常用功能和HBase+MapReduce使用總結 經驗

hadoop mapreduce核心功能描述 經驗

MapReduce的組合式，迭代式，鏈式 經驗

MapReduce中combine、partition、shuffle的作用是什么 經驗

MapReduce 超大機群上的簡單數據處理 文檔

探索C#之微型MapReduce 經驗

MapReduce 四種基本設計模式 經驗

Disco - 基于MapReduce的分布式計算框架 經驗

如何將 MongoDB MapReduce 速度提升 20 倍 經驗

MapReduce超大集群的簡單數據處理 文檔

Spark vs. MapReduce 時間節約66%，計算節約40% 資訊

Google MapReduce原文 的相關搜索

關鍵詞

MapReduce模式、算法和用例資訊

MapReduce程序reduce輸出控制經驗

CG_Hadoop：基于MapReduce的計算幾何經驗

基于MapReduce編程模型的圖計算框架經驗

Spark 是否真的比 MapReduce 技高一籌資訊

Mapreduce任務實現郵件監控代碼段

HBase常用功能和HBase+MapReduce使用總結經驗

hadoop mapreduce核心功能描述經驗

MapReduce的組合式，迭代式，鏈式經驗

MapReduce中combine、partition、shuffle的作用是什么經驗

MapReduce 超大機群上的簡單數據處理文檔

MapReduce 四種基本設計模式經驗

Disco - 基于MapReduce的分布式計算框架經驗

如何將 MongoDB MapReduce 速度提升 20 倍經驗

MapReduce超大集群的簡單數據處理文檔

Google MapReduce原文的相關搜索