開源項目,開源代碼,開源文檔,開源新聞,開源社區

P49

ConnectorNoSQLTransformLoad 可直接從HDFS加載數據優化并行支持Pig、Hive與MapReduce 18. 查詢謂詞下壓，利用數據庫索引提升性能查詢關聯索引掃描T.Price

tony2007 2015-06-19 1856 0

Hadoop 分布式/云計算/大數據方案 x86 JSON

13 in Sqoop builds [ SQOOP-1324 ] - Support new hive datatypes in Sqoop hcatalog integration [ SQOOP-1325

jopen 2014-08-13 13701 0

Apache Sqoop

P2

運行在計算機集群上面，用于管理Hadoop操作。 5) Hive：Hive類似于SQL高級語言，用于運行存儲在Hadoop上的查詢語句，Hive讓不熟悉MapReduce開發人員也能編寫數據查詢語句，

fangunun 2016-12-22 643 0

Hadoop 分布式/云計算/大數據

分布式數據庫中HBase中，一個例子，求各url的訪問pv數據,由于用到rcfile格式需要導入hive-exce包，還需要加載hbase包，如果這兩個包都已經被集群管理員放到各節點的hadoop/l

openkk 2012-08-26 34241 0

分布式/云計算/大數據 HBase

S，支持健全的 SQL子集JDBC和其運作。雖然Phoenix的速度比Hive快，但是我并不認為它們會取代Hive，因為Hive目前仍然非常適合那些你不想遷移至 HBase但又想以其它方式進行分析的平面文件。Pheonix由James

fn67 2015-03-21 15211 0

Hadoop 分布式/云計算/大數據

P27

周敏日期：2010-05-26 2. OutlineHadoop基本概念 Hadoop的應用范圍 Hadoop底層實現原理 Hive與數據分析 Hadoop集群管理典型的Hadoop離線分析系統架構常見問題及解決方案 3. 關于打撲克的哲學

zhpboy 2013-10-12 4361 0

Hadoop 分布式/云計算/大數據方案 SQL Go

的用戶界面和良好的數據回溯工具。堪稱大數據工具箱里的瑞士軍刀。 Apache Hive 2.1——Hive是建立在 Hadoop 上的數據倉庫基礎構架。它提供了一系列的工具，可以用來進行數據提

黃色騰堡 2016-09-29 12525 0

大數據開源 Hadoop 分布式/云計算/大數據

務。 H adoop的簡單數據管理需求用HDFS就可以做到，但是更復雜的應用需要HBase和Hive。 HBase是一種列數據存儲類型的NoSQL數據庫。它被設計成可以支持十億級別的行和列的超

jopen 2014-12-17 9930 0

Hadoop

該項目主要特性：簡單元數據層為數據存儲提供抽象視圖層單一的共享模式服務器，基于 Hive 元存儲。模式通過數據管道 HCatalog 和分析應用進行共享： OLAP Cube QL

c8yy 2015-11-24 11048 0

Apache Lens

ra的數據模型提供了方便的二級索引（column indexe）。 5. Hive Apache Hive是Hadoop的一個數據倉庫系統，促進了數據的綜述（將結構化的數據文件映射為一張數

jopen 2014-04-30 52548 0

開源

離線數據分析與計算，也就是對實時性要求不高的部分，在我看來，Hive還是首當其沖的選擇，豐富的數據類型、內置函數；壓縮比非常高的ORC文件存儲格式；非常方便的SQL支持，使得Hive在基于結構化數據上的統計分析遠遠比Ma

jopen 2015-10-17 110870 0

數據

在開始使用 Hadoop，但是在很多情況下他們的使用僅限于大量數據的存儲和對這些數據執行簡單的 Hive/SQL 查詢。你認為這種趨勢將會繼續么？ McJannet ：我認為 Hadoop 在某

jopen 2013-12-19 14151 0

Hadoop

P14

//wiki.apache.org/pig/EmbeddedPig 12. Pig與RDBMS、Hive比較 Pig Latin是一種數據流編程語言，而SQL是一種描述性編程語言。換句話說，Pig程序

706394187 2015-05-23 2379 0

分布式/云計算/大數據 Java SQL

k類似“SQL on Spark”，是一個在Spark上數據倉庫的實現，在兼容Hive的情況下，性能最高可以達到Hive的一百倍。 Apache Spark 是在 Scala 語言中實現的，它將 Scala

jopen 2014-12-11 177140 0

Spark SQL 分布式/云計算/大數據

P158

是，”直接使用sql語句來對數據進行分析“。這也是為什么Hive興起的原因了。Hive的流行直接證明這種設計迎合了市場的需求。由于Hive是采用了Hadoop的MapReduce作為分析執行引擎，

bxingqing 2017-06-12 1332 0

分布式/云計算/大數據

P25

支持向量機，英文為Support Vector Machine，簡稱SV機（論文中一般簡稱svm）。它是一種監督式學習的方法，它廣泛的應用于統計分類以及回歸分析中。支持向量機屬于一般化線性分類器.他們也可以認為是提克洛夫規范化（Tikhonov

岳麓丹楓 2014-09-29 800 0

機器學習

存使用情況；計算直接發生在二進制格式上，省去了序列化和反序列化時間。像傳統的Hadoop/Hive系統，磁盤IO是一個很大的瓶頸。而對于像Spark這樣的計算框架，主要的瓶頸在于CPU和內存。下

jopen 2016-01-07 38554 0

Spark 數據挖掘

）能力以支持超大規模數據，最初由eBay Inc. 開發并貢獻至開源社區。它能在亞秒內查詢巨大的Hive表。 KYLIN是什么? - 可擴展超快OLAP引擎: Kylin是為減少在Hadoop上百億規模數據查詢延遲而設計

jopen 2016-07-29 12355 0

分布式分析 Apache Kylin

方案解決方案1：Hadoop + Hive。思路：使用Hadoop HDFS來存儲數據，通過Hdoop MapReduce完成數據計算，通過Hive HQL語言使用部分與RDBBS一樣的表格查詢特性和分布式存儲計算特性。

jopen 2014-09-20 40840 0

分布式

P3

HADOOP_HOME=/opt/sohuhadoop/hadoop export HIVE_HOME=/opt/sohuhadoop/hive export CLASSPATH=.:$JAVA_HOME/lib/tools

wkz_214 2011-09-14 8264 0

Hadoop 分布式/云計算/大數據

文檔式數據庫在Hadoop集群中的應用文檔

Hadoop與關系數據庫數據相互遷移工具 Apache Sqoop 1.4.5 發布資訊

big資料文檔

Hbase基于Mapreduce的編程經驗

不得不了解的Hadoop知識經驗

Hadoop與數據分析文檔

大數據領域開源技術除了Hadoop你還知道哪些經驗

Hadoop工具在其不斷進化中披荊斬棘資訊

統一數據分析接口，Apache Lens 2.4.0-beta 發布資訊

13款開源Java大數據工具經驗

大數據環境下互聯網行業數據倉庫/數據平臺的架構之漫談經驗

對Hadoop目前使用情況的調查和采訪資訊

Pig 介紹文檔

Spark SQL 初探：使用大數據分析2000萬數據經驗

apache-spark源碼走讀文檔

機器學習十大算法文檔

解讀2015之Spark篇：新生態系統的形成資訊

分布式分析引擎 Apache Kylin v1.5.3 正式發布資訊

分布式數據庫架構--排序、分頁、分組、實現經驗

hadoop客戶端部署文檔

Hive學習筆記的相關搜索

關鍵詞

文檔式數據庫在Hadoop集群中的應用 文檔

Hadoop與關系數據庫數據相互遷移工具 Apache Sqoop 1.4.5 發布 資訊

big資料 文檔

Hbase基于Mapreduce的編程 經驗

不得不了解的Hadoop知識 經驗

Hadoop與數據分析 文檔

大數據領域開源技術 除了Hadoop你還知道哪些 經驗

Hadoop工具在其不斷進化中披荊斬棘 資訊

統一數據分析接口，Apache Lens 2.4.0-beta 發布 資訊

13款開源Java大數據工具 經驗

大數據環境下互聯網行業數據倉庫/數據平臺的架構之漫談 經驗

對Hadoop目前使用情況的調查和采訪 資訊

Pig 介紹 文檔

Spark SQL 初探： 使用大數據分析2000萬數據 經驗

apache-spark源碼走讀 文檔

機器學習十大算法 文檔

解讀2015之Spark篇：新生態系統的形成 資訊

分布式分析引擎 Apache Kylin v1.5.3 正式發布 資訊

分布式數據庫架構--排序、分頁、分組、實現 經驗

hadoop客戶端部署 文檔

Hive學習筆記 的相關搜索

關鍵詞

文檔式數據庫在Hadoop集群中的應用文檔

Hadoop與關系數據庫數據相互遷移工具 Apache Sqoop 1.4.5 發布資訊

big資料文檔

Hbase基于Mapreduce的編程經驗

不得不了解的Hadoop知識經驗

Hadoop與數據分析文檔

大數據領域開源技術除了Hadoop你還知道哪些經驗

Hadoop工具在其不斷進化中披荊斬棘資訊

統一數據分析接口，Apache Lens 2.4.0-beta 發布資訊

13款開源Java大數據工具經驗

大數據環境下互聯網行業數據倉庫/數據平臺的架構之漫談經驗

對Hadoop目前使用情況的調查和采訪資訊

Pig 介紹文檔

Spark SQL 初探：使用大數據分析2000萬數據經驗

apache-spark源碼走讀文檔

機器學習十大算法文檔

解讀2015之Spark篇：新生態系統的形成資訊

分布式分析引擎 Apache Kylin v1.5.3 正式發布資訊

分布式數據庫架構--排序、分頁、分組、實現經驗

hadoop客戶端部署文檔

Hive學習筆記的相關搜索