開源項目,開源代碼,開源文檔,開源新聞,開源社區

P18

unt是Hadoop自帶的一個例子，目標是統計文本文件中單詞的個數。假設有如下的兩個文本文件來運行WorkCount程序： Hello World Bye World Hello Hadoop GoodBye

wanghaoms 2013-03-05 3360 0

分布式/云計算/大數據

P8

，Google在處理大數據方面，果真有得天獨厚的優勢。下面的內容，很大部分來自這篇論文。隨著Hadoop的流行，大規模的數據分析系統已經越來越普及。數據分析師需要一個能將數據“玩轉”的交互式系統。如

beijixing022 2013-12-12 363 0

Go

P19

大數據學習網介紹我們的網址是：bigdatastudy.cn 我們提供專業的大數據學習視頻，包括Hadoop，Spark，Storm，Mahout，機器學習等。我們定價合理，讓每個人都學得起大數據。 3

ngn6 2015-08-12 775 0

分布式/云計算/大數據 Apache Java JSON Python

P18

大數據學習網介紹我們的網址是：bigdatastudy.cn 我們提供專業的大數據學習視頻，包括Hadoop，Spark，Storm，Mahout，機器學習等。我們定價合理，讓每個人都學得起大數據。 3

ngn6 2015-08-12 631 0

分布式/云計算/大數據 Java Python Scala

P9

?Namenode啟動過程分析我這里所講的是hadoop-0.20.2-cdh3u1版本已regular方式啟動時的代碼流程分析。在namenode啟動時會首先去構造Configuration對象

光榮復興 2014-03-30 2154 0

分布式/云計算/大數據

P9

上宣布，他們每天的數據凈增量達到了1個PB，每個禮拜需要新增1000臺服務器存儲這些數據。再來看看我們自己公司內部的情況，基于hadoop的云梯一群集已經達到了1400臺服務器的規模，淘寶數據倉庫的數據量已經達到了1PB（實際存儲3

videostorm 2013-10-26 485 0

分布式/云計算/大數據

P10

部分，特別是《Mahout 實戰》一書。此外，我假設讀者具備 Apache Hadoop 和 Map-Reduce 范式方面的基本知識。（有關 Hadoop 的更多信息，請參閱參考資料部分。） Mahout 現狀

beiwei1121 2014-09-23 492 0

機器學習 Apache

P7

?大數據存儲和處理技術 ? Hadoop:分布式存儲和計算平臺 ? HDFS：分布式文件系統 ? MapReduce：分布式計算框架 ? NOSQL：分布式數據庫 ? MPP、內存計算與流計算平臺 ?

loveqiqi 2015-05-09 693 0

分布式/云計算/大數據

P64

8. 大數據主要與大型數據集相關在大數據的新世界中，我們必須更換所有陳舊系統大數據就是 Hadoop 較為陳舊的事務數據已經不再重要數據倉庫已是昨日黃花大數據適合熟知互聯網的企業。傳統業務與大數據毫無關系

guet_lee 2017-01-15 10670 0

分布式/云計算/大數據方案報告 Intel C/C++

P26

??Hive是Hadoop項目中的一個子項目，由FaceBook向Apache基金會貢獻，其中TaoBao也是其中一位使用者+貢獻者，Hive被視為一個倉庫工具，可以將結構化的數據文件映射為一張數據庫表，并可以將sql語句轉換為

hywhyw1985 2013-05-24 3884 0

分布式/云計算/大數據

P4

?Ganglia的安裝與配置 0 ?前記： ? ? ? ?之前由于Hadoop集群的搭建和數據的收集，再一次部署了Ganglia來收集系統層監測數據。 ? ? ? ?雖然之前已經部署過一次，但是此次部

真不是夢 2017-01-05 1860 0

系統監控

P4

numPartitions); 函數返回對于的reduce task ID 用戶也可以不提供Partitioner，這是Hadoop會使用默認的。 2.4 Combiner Combiner使得map task與reduce

gaofei8704 2013-06-19 624 0

分布式/云計算/大數據

P4

（Java私塾）MapReduce實例第一部分：?什么是?MapReduce ????????????? Hadoop Map/Reduce是一個使用簡易的軟件框架，基于它寫出來的應用程序能夠運行在由上千個商用機

singing 2014-01-09 2559 0

分布式/云計算/大數據

P4

numPartitions); 函數返回對于的reduce task ID 用戶也可以不提供Partitioner，這是Hadoop會使用默認的。 2.4 Combiner Combiner使得map task與reduce

gaofei8704 2013-06-25 290 0

分布式/云計算/大數據

P35

管理不同類型企業數據資源的典型技術半/非結構化數據以批量結構化處理為主主要用于與結構化數據整合的大數據分析場景 Hadoop的分布式計算架構非常適合處理社交媒體、移動互聯等典型的半/非結構化數據，被廣泛應用于大數據領域

gavin_xzw 2017-04-09 10339 0

方案報告 Apache Intel Go

P11

操作工具類代碼 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HColumnDescriptor;

beauty2003 2016-05-10 2073 0

P76

審計系統自動化運維系統Hive運行時監控系統實時分析系統可視化引擎數據監控和管理系統Hadoop Map ReduceHadoop HDFSDatax報表需求(淘數據)數據開發界面Hbase元數據中心

hans511002 2012-06-24 4302 0

分布式/云計算/大數據方案培訓 HTTP Java

P4

?hbase,hive,hadoop一個演示的例子。 1. 在終端上創建表；（hive） CREATE EXTERNAL TABLE MYRELATION( key INT, name STRING,telphone1

xnbw 2016-01-11 472 0

分布式/云計算/大數據

P10

/bin/hadoop fs -copyFromLocal test.log /hdfs/ 三、運行map red /bin/hadoop jar contrib/streaming/hadoop-streaming-0

gppxm 2012-10-19 449 0

分布式/云計算/大數據

P39

1安裝客戶端首先獲得客戶端軟件，然后解壓安裝包（以下用$HADOOP_HOME代替hadoop客戶端解壓后的路徑）： $ tar -xzvf hadoop-0.20.1-tdw-0.1-lite.tar.gz

gtimehero 2013-01-04 1102 1

數據挖掘手冊

MapReduce 源碼分析完整版文檔

Google Dremel 原理-如何能3秒分析1PB 文檔

(1)Spark簡介文檔

(2)Spark 基礎知識文檔

Namenode 啟動過程分析文檔

一位架構師談海量計算存儲文檔

Apache Mahout：適合所有人的可擴展機器學習框架文檔

大數據存儲和處理技術文檔

大數據智能分析解決方案介紹-ibm 文檔

Hive and Hbase入門文檔

ganglia的安裝與配置文檔

MapReduce 程序編程框架文檔

MapReduce 實例文檔

MapReduce 程序編程框架文檔

pivotal-bigdata-suite-overview 文檔

hbase 數據表介紹文檔

淘寶數據開發平臺介紹文檔

一個hive hbase hdoop+eclipse的實例文檔

MapReduce 數據分析實戰文檔

騰訊TDW分布式數據倉庫用戶手冊文檔

Hadoop 的相關搜索

關鍵詞

MapReduce 源碼分析完整版 文檔

Google Dremel 原理-如何能3秒分析1PB 文檔

(1)Spark簡介 文檔

(2)Spark 基礎知識 文檔

Namenode 啟動過程分析 文檔

一位架構師談海量計算存儲 文檔

Apache Mahout：適合所有人的可擴展機器學習框架 文檔

大數據存儲和處理技術 文檔

大數據智能分析解決方案介紹-ibm 文檔

Hive and Hbase入門 文檔

ganglia的安裝與配置 文檔

MapReduce 程序編程框架 文檔

MapReduce 實例 文檔

MapReduce 程序編程框架 文檔

pivotal-bigdata-suite-overview 文檔

hbase 數據表介紹 文檔

淘寶數據開發平臺介紹 文檔

一個hive hbase hdoop+eclipse的實例 文檔

MapReduce 數據分析實戰 文檔

騰訊TDW分布式數據倉庫用戶手冊 文檔

Hadoop 的相關搜索

關鍵詞

MapReduce 源碼分析完整版文檔

(1)Spark簡介文檔

(2)Spark 基礎知識文檔

Namenode 啟動過程分析文檔

一位架構師談海量計算存儲文檔

Apache Mahout：適合所有人的可擴展機器學習框架文檔

大數據存儲和處理技術文檔

Hive and Hbase入門文檔

ganglia的安裝與配置文檔

MapReduce 程序編程框架文檔

MapReduce 實例文檔

MapReduce 程序編程框架文檔

hbase 數據表介紹文檔

淘寶數據開發平臺介紹文檔

一個hive hbase hdoop+eclipse的實例文檔

MapReduce 數據分析實戰文檔

騰訊TDW分布式數據倉庫用戶手冊文檔