開源項目,開源代碼,開源文檔,開源新聞,開源社區

完全開源，免費，非商業。apache社區的hadoop版本分枝較多，而且部分hadoop存在bug。在選擇hadoop，hbase，hive等時，需要考慮兼容性。 Cloudera版本：開源，免費，有商業和非商業版本。是在apac

jopen 2016-01-18 8804 0

分布式/云計算/大數據

景差異也很大，這就產生出很多不同類型的程序(任務)運行在大數據平臺之上，如：MapReduce、Hive、Pig、Spark、Java、Shell、Python等。這些任務需要不同的運行環境，并

jopen 2015-10-20 52068 0

大數據

Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等。然而,最新的官方版本是0.5.0,還不支持R

solari 2016-02-12 78611 0

Zeppelin 數據分析分布式/云計算/大數據

習、即席查詢（ad-hoc?query）、圖計算等應用，Spark版本比基于MapReduce、Hive和Pregel的實現快上十倍到百倍。其中內存計算、數據本地性?（locality）和傳輸優化、調

jopen 2014-08-14 51313 0

分布式/云計算/大數據 Spark

Hadoop包含了MapReduce、HDFS、HBase、Hive、Zookeeper、Pig、Sqoop等 ○ BDAS包含了Spark、Shark（相當于Hive）、BlinkDB、Spark Streaming（消息實時處理框架

jopen 2015-06-25 53456 0

Spark 分布式/云計算/大數據

HBase[6]實現持久化；用Memcached作為MySQL緩存與通用緩存。用Hadoop和Hive實現離線處理。類似日志、鏈接與feed之類的數據傳輸用Scribe[7]實現；用Scribe-HDFS

jopen 2016-01-19 25626 0

Facebook 軟件架構

[KYLIN-436] 無法從“default”以外的Hive數據庫同步表，新的版本允許Kylin Cube使用來自不同數據庫的表 2. [KYLIN-412] Hive表沒有讀取權限時的異常處理 3. [KYLIN-508]

jopen 2015-06-14 12337 0

Apache Kylin

0 Chukwa 流水線原始的數據流水線，唯一目的就是聚合事件，并將其上傳到 Hadoop/Hive 進行批處理。從下圖中也可以看出，架構相當簡單。 Chukwa 收集數據，并以 Hadoop 順序文件格式將它們寫入到

jopen 2016-02-18 8974 0

Kafka

0.2。我正在補充這兩個參數的TestCase，準備提交到trunk中。 12. 多用hive少用streaming 由于streaming的方便快捷，我們做了很多基于它的開發。但是由于

jopen 2012-09-22 1054 0

thinkjs

P31

Hadoop Usage at FacebookData warehouse running Hive 600 machines, 4800 cores, 2.4 PB disk 3200 jobs

hadoopfans 2010-11-20 3577 0

Hadoop 分布式/云計算/大數據 Scala SQL Basic

YARN。Spark可以與MapReduce運行于同集群中，共享存儲資源與計算，數據倉庫Shark實現上借用Hive，幾乎與Hive完全兼容。 Spark 的核心概念 1、Resilient Distributed

jopen 2014-12-03 46280 0

Spark 分布式/云計算/大數據

， R 的 shell 中進行交互式查詢。 q ? 支持查詢。 Spark 支持 SQL 及 Hive SQL 對數據查詢。 q ? 支持流式計算。與 MapReduce 只能處理離線數據相比，

沒心沒肺 2016-01-27 56246 0

Spark 分布式/云計算/大數據

P50

Lucene締造者 Hadoop是Apache下的一個開源項目，由 HDFS MapReduce 、 HBase、Hive和ZooKeeper等成員組成Doug Cutting 19. Hadoop已被廣泛所接受Com

lxj2008 2014-01-19 13806 0

分布式/云計算/大數據方案報告 Apache Go

Wormhole 是大眾點評的大數據傳輸工具，目前支持類似 hdfs, hive, hbase, mysql, greenplum, sqlserver, mongodb, sftp, salesforce

jopen 2014-11-22 22512 0

Wormhole

或多個HBase scan，并編排執行以生成標準的JDBC結果集，對于簡單查詢來說，性能甚至勝過Hive。項目主頁： http://www.baiduhome.net/lib/view/home/1361323035978

jopen 2013-02-19 22201 0

HBase 分布式/云計算/大數據

Impala 的首個 beta 版。Impala 允許你在 Hadoop 的 HDFS 、 Hbase 和 Hive 之上運行實時查詢。不必遷移。來自: Solidot

jopen 2012-12-09 11617 0

Hadoop

抽象出表，使用戶不必關心他們的數據怎么存儲。提供可操作的跨數據處理工具，如Pig，MapReduce，Streaming，和Hive。項目主頁： http://www.baiduhome.net/lib/view/home/1339233432662

openkk 2012-06-09 39460 0

Hadoop 分布式/云計算/大數據

典型大數據計算模式與系統典型大數據計算模式典型系統大數據查詢分析計算 HBase，Hive，Cassandra，Impala，Shark，Hana等批處理計算 Hadoop?MapReduce，Spark等

jopen 2015-01-13 24959 0

大數據分布式/云計算/大數據

P227

Shark ( Hive on Spark): Shark基本上就是在Spark的框架基礎上提供和Hive一樣的H iveQL命令接口，為了最大程度的保持和Hive的兼容性，Shark使用了Hive的API來實現

larruping 2017-01-03 1040 0

方案報告 Apache Basic diff

Map-Reduce an Streaming Jobs 集成 Cascading, HBase, Hive 和 Pig 項目主頁： http://www.baiduhome.net/lib/view/home/1330560406421

jopen 2012-02-29 27298 0

Spring Hadoop 分布式/云計算/大數據

hadoop再次集群搭建（3）-如何選擇相應的hadoop版本經驗

大數據平臺任務調度與監控系統資訊

【譯】大數據分析平臺搭建教程：基于Apache Zeppelin Notebook和R的交互式數據科學經驗

什么是spark 經驗

關于Spark的基本概念和特性簡介經驗

Facebook架構解讀經驗

Apache Kylin (Incubating) 0.7.1 發布資訊

從 Chukwa 到 Keystone ：Netflix 的數據流水線演進資訊

hadoop優化博客

The hadoop Fair Scheduler 文檔

Spark：比Hadoop更強大的分布式數據計算項目經驗

Spark設計理念與基本架構經驗

大數據及相關技術介紹文檔

大眾點評的大數據傳輸工具：wormhole 經驗

HBase上使用SQL查詢：Phoniex 經驗

2013年Hadoop實時查詢將成現實資訊

HCatalog - 基于Hadoop數據表和存儲管理服務經驗

典型大數據計算模式與系統經驗

spark學習筆記文檔

Spring Hadoop - 為開發 Apache Hadoop 應用程序提供支持經驗

Hive學習筆記的相關搜索

關鍵詞

hadoop再次集群搭建（3）-如何選擇相應的hadoop版本 經驗

大數據平臺任務調度與監控系統 資訊

【譯】大數據分析平臺搭建教程：基于Apache Zeppelin Notebook和R的交互式數據科學 經驗

什么是spark 經驗

關于Spark的基本概念和特性簡介 經驗

Facebook架構解讀 經驗

Apache Kylin (Incubating) 0.7.1 發布 資訊

從 Chukwa 到 Keystone ：Netflix 的數據流水線演進 資訊

hadoop優化 博客

The hadoop Fair Scheduler 文檔

Spark：比Hadoop更強大的分布式數據計算項目 經驗

Spark設計理念與基本架構 經驗

大數據及相關技術介紹 文檔

大眾點評的大數據傳輸工具：wormhole 經驗

HBase上使用SQL查詢：Phoniex 經驗

2013年Hadoop實時查詢將成現實 資訊

HCatalog - 基于Hadoop數據表和存儲管理服務 經驗

典型大數據計算模式與系統 經驗

spark學習筆記 文檔

Spring Hadoop - 為開發 Apache Hadoop 應用程序提供支持 經驗

Hive學習筆記 的相關搜索

關鍵詞

hadoop再次集群搭建（3）-如何選擇相應的hadoop版本經驗

大數據平臺任務調度與監控系統資訊

【譯】大數據分析平臺搭建教程：基于Apache Zeppelin Notebook和R的交互式數據科學經驗

關于Spark的基本概念和特性簡介經驗

Facebook架構解讀經驗

Apache Kylin (Incubating) 0.7.1 發布資訊

從 Chukwa 到 Keystone ：Netflix 的數據流水線演進資訊

hadoop優化博客

Spark：比Hadoop更強大的分布式數據計算項目經驗

Spark設計理念與基本架構經驗

大數據及相關技術介紹文檔

2013年Hadoop實時查詢將成現實資訊

HCatalog - 基于Hadoop數據表和存儲管理服務經驗

典型大數據計算模式與系統經驗

spark學習筆記文檔

Spring Hadoop - 為開發 Apache Hadoop 應用程序提供支持經驗

Hive學習筆記的相關搜索