開源項目,開源代碼,開源文檔,開源新聞,開源社區

下一個數據孤島，因此SQL-on-Hadoop獲得了越來越多的關注。 Apache Hive 0.13發布。Hive是最早的基于Hadoop的SQL引擎。 Apache 基金會宣布Apache Dri

jopen 2015-01-12 14522 0

Hadoop

P25

五，Hadoop結合項目說明六，性能測試七，擴展產品 1，云計算產品概況 Hadoop數據倉庫Hive，可以學習學習，Hive提供了SQL編程接口，為Hadoop在數據倉庫應用邁出了一大步。數據倉庫通常將大量數

7at7 2011-04-27 3440 0

Hadoop 分布式/云計算/大數據

rpm hbase-0.92.1-cdh4.1.2.p0.24.el5.noarch.rpm hive-0.9.0-cdh4.1.2.p0.21.el5.noarch.rpm oozie-3.2

jopen 2013-12-18 40475 0

Hadoop 分布式/云計算/大數據

P76

Data IntegrationDB syncTT調度系統安全控制系統審計系統自動化運維系統Hive運行時監控系統實時分析系統可視化引擎數據監控和管理系統Hadoop Map ReduceHadoop

hans511002 2012-06-24 4302 0

分布式/云計算/大數據方案培訓 HTTP Java

學習、即席查詢（ad-hoc query）、圖計算等應用，Spark版本比基于MapReduce、Hive和Pregel的實現快上十倍到百倍。其中內存計算、數據本地性（locality）和傳輸優化、調

jopen 2014-09-12 16979 0

Spark

領導的開發團隊利用不同的組件，包括開源數據庫、 PostgreSQL 、 Apache Hadoop 數據分類技術和 Hive （ Facebook 公司開發的內部 Hadoop 項目）開發出的新型數據庫。 HadoopDB

fmms 2012-01-28 45083 0

數據庫服務器 NOSQL

SQL：可以執行 SQL 查詢，包括基本的 SQL 語法和 HiveQL 語法。讀取的數據源包括 Hive 表、Parquent 文件、JSON 數據、關系數據庫（MySQL 等）等。 Spark Streaming：Spark

jopen 2016-03-07 7128 0

Spark

運行環境要求： Hadoop Hadoop: 2.2.0.2.0.6.0-61 or above Hive: 0.12.0.2.0.6.0-61 or above HBase: 0.96.0.2.0

jopen 2015-03-06 15918 0

Apache Kylin

“當用戶登錄到計算機時，系統會調用用戶配置文件服務來創建特定的目錄并掛載用戶注冊表 Hive 文件（普通賬戶沒有該權限）。在理論上，除了加載 Hive 文件之外，特權賬戶需要做的唯一事情就是創建基礎配置文件目錄。這應該

jopen 2015-01-15 18279 0

Windows 8.1

是眾多SQL on Hadoop中的一個，此外還包括： Hadoop上原生的Hive Hortonworks主導的Hive演進項目Stinger Cloudera主導的Impala MapR主導的Apache

jopen 2015-05-20 10665 0

Apache Drill

增強了清理任務以確保Cube構建成功后在本地操作系統，HDFS／HBase等不遺留垃圾文件等添加配置項允許講Hive中間表輸出到指定數據庫增強HBase Corprocessor 以提升查詢性能 Kylin

jopen 2015-09-06 16414 0

Apache Kylin

（發表于2004年12月），是Google MapReduce克隆版 Hive：由facebook開源，基于MR的數據倉庫，數據計算使用MR，數據存儲使用HDFS，Hive 定義了一種類 SQL 查詢語言——HQL：類似SQL，但不完全相同

jopen 2016-01-20 22814 0

分布式/云計算/大數據

P18

行列混合存儲+Mapreduce EMC Greenplum Teradata Asterdata Hive(RCFile) 9. Google 數據分析技術列表MapReduce GFS Bigtable

mvpzhou 2013-10-08 3208 0

Intel Java Scala SQL Go

Reference and Developers Guide for more. Hive Translator - Hive translator has been added as a technology

fmms 2011-11-29 6791 0

Java

parquet.compression.codec: snappy -> gzip spark.sql.hive.convertMetastoreParquet: false -> true spark.sql

jopen 2014-12-19 23822 1

Spark

P23

actorId.全部初始化到表中。 2.2 啟動流程 1）根據路徑解析*.bpmn2或*.bpmn 檔,放入到記憶體中。在該類註冊了相關的物件org.jbpm.bpmn2.xml.BPMNSemanticModule

huav06 2012-11-27 427 0

jBPM 工作流引擎

dist/hadoop-hdfs/HdfsUserGuide.html 9. Hive Apache Hive是面向Hadoop生態系統的數據倉庫。它讓用戶可以使用HiveQL查詢和管理大數據，這是一種類似SQL的語言。

jopen 2015-11-14 179651 0

大數據分布式/云計算/大數據

t-dist/hadoop-hdfs/HdfsUserGuide.html 9. Hive Apache Hive是面向Hadoop生態系統的數據倉庫。它讓用戶可以使用HiveQL查詢和管理大數據，這是一種類似SQL的語言。

jopen 2015-10-23 46305 0

Hadoop

以及內存表等優勢，承擔了日志數據的即席查詢工作。在性能方面，普遍比Hive高2-10倍，如果使用內存表的功能，性能將會比Hive快百倍。 Yahoo 。Yahoo將Spark用在Audience E

jopen 2014-11-29 53806 0

Spark 分布式/云計算/大數據

用其基于內存的特點，特別擅長迭代式和交互式數據處理；Shark處理大規模數據的 SQL查詢，兼容Hive的HQL。本文要重點介紹的Spark??? Streaming，在整個BDAS中進行大規模流式處理。

jopen 2014-11-17 109482 0

Spark 分布式/云計算/大數據

2014年Hadoop大事件盤點資訊

Hadoop進階文檔

通過cloudera-manager來安裝hadoop 經驗

淘寶數據開發平臺介紹文檔

開源集群計算環境，Spark 1.1.0 發布資訊

分布式大規模數據庫系統 HadoopDB 簡介經驗

Spark生態頂級項目匯總資訊

開源的分布式的 OLAP 分析引擎，Apache Kylin 提供二進制安裝包資訊

谷歌再曝Windows 8.1漏洞，微軟真的怒了資訊

Apache Drill 1.0發布資訊

分布式分析引擎，Apache Kylin v1.0 發布資訊

大數據(一) - hadoop生態系統及版本演化經驗

admaster海量數據分析架構-admaster_謝超文檔

數據虛擬化系統 Teiid 7.6 Final 發布資訊

開源分布式計算系統，Spark 1.2 發布資訊

Jbpm5 持久化及流轉流程剖析文檔

60款頂級大數據開源工具經驗

Hadoop和大數據：60款頂級大數據開源工具資訊

Spark在騰訊數據倉庫TDW的應用經驗

Spark介紹經驗

Hive學習筆記的相關搜索

關鍵詞

2014年Hadoop大事件盤點 資訊

Hadoop進階 文檔

通過cloudera-manager來安裝hadoop 經驗

淘寶數據開發平臺介紹 文檔

開源集群計算環境，Spark 1.1.0 發布 資訊

分布式大規模數據庫系統 HadoopDB 簡介 經驗

Spark生態頂級項目匯總 資訊

開源的分布式的 OLAP 分析引擎，Apache Kylin 提供二進制安裝包 資訊

谷歌再曝Windows 8.1漏洞，微軟真的怒了 資訊

Apache Drill 1.0發布 資訊

分布式分析引擎，Apache Kylin v1.0 發布 資訊

大數據(一) - hadoop生態系統及版本演化 經驗

admaster海量數據分析架構-admaster_謝超 文檔

數據虛擬化系統 Teiid 7.6 Final 發布 資訊

開源分布式計算系統，Spark 1.2 發布 資訊

Jbpm5 持久化及流轉流程剖析 文檔

60款頂級大數據開源工具 經驗

Hadoop和大數據：60款頂級大數據開源工具 資訊

Spark在騰訊數據倉庫TDW的應用 經驗

Spark介紹 經驗

Hive學習筆記 的相關搜索

關鍵詞

2014年Hadoop大事件盤點資訊

Hadoop進階文檔

淘寶數據開發平臺介紹文檔

開源集群計算環境，Spark 1.1.0 發布資訊

分布式大規模數據庫系統 HadoopDB 簡介經驗

Spark生態頂級項目匯總資訊

開源的分布式的 OLAP 分析引擎，Apache Kylin 提供二進制安裝包資訊

谷歌再曝Windows 8.1漏洞，微軟真的怒了資訊

Apache Drill 1.0發布資訊

分布式分析引擎，Apache Kylin v1.0 發布資訊

大數據(一) - hadoop生態系統及版本演化經驗

admaster海量數據分析架構-admaster_謝超文檔

數據虛擬化系統 Teiid 7.6 Final 發布資訊

開源分布式計算系統，Spark 1.2 發布資訊

Jbpm5 持久化及流轉流程剖析文檔

60款頂級大數據開源工具經驗

Hadoop和大數據：60款頂級大數據開源工具資訊

Spark在騰訊數據倉庫TDW的應用經驗

Spark介紹經驗

Hive學習筆記的相關搜索