開源項目,開源代碼,開源文檔,開源新聞,開源社區

進行配置。Genie 獨立于特定運行時配置或待處理數據，生成 Spark、Hadoop、Pig、Hive、PrestoDB 和 Sqoop 等類型的應用程序運行腳本。作為開發人員，本地模式工作流能夠為不同運行時生成運行腳本，同時還集成了

jopen 2017-07-16 10621 0

Netflix

atalog，一個元數據管理系統，此外還有一些常見的與 Hadoop 平臺相結合使用的，Pig、Hive、HBase 及 Zookeeper 等。在接下來的幾周里，Hortonworks 計劃發布基于

openkk 2011-11-06 12989 1

Hadoop

算法在組織數據上節省系統資源。從 LinkedIn 博客我們知道：現存引擎 Apache Pig、Hive 以及 Shark 提供一個合乎邏輯的聲明性語言，然后被翻譯成一個實物計劃。這個計劃執行分布式引擎（Map-Reduce、Tez

jopen 2014-11-12 8535 0

Cubert

P8

少，但是薪水待遇最高。數據管理/大數據平臺 Spark作為大數據新星，21%的人在使用，傳統的Hive仍舊有20%的使用，Redshift被提到了兩次（上面關系型數據庫也提到了Redshift），也

wpwan 2016-12-10 603 0

報告 Apache Python Scala SQL

在大數據領域已經陸續推出 Spark、Hadoop、Storm、HBase、ZooKeeper、Hive、SparkMR、QingMR 等一系列大數據服務，能為企業提供計算、存儲、分析、查詢一站式全方位的大數據服務。

五嘎子 2020-05-29 1686 0

青云數據庫分布式 PolonDB

P12

最高達約50道作業每天運行20小時以上 Oracle RAC集群最多20個節點 Hadoop Hive淘寶數據分析選型歷程 4. Hadoop是什么一個Map/Reduce框架實現一個開源項目一個分布式計算平臺一個分布式文件系統

wsldg 2012-02-28 678 0

Hadoop 分布式/云計算/大數據 Java SQL

的RDD、Parquet（列式存儲格式）類型文件、JSON數據集，或通過運行HiveQL獲取存儲在Apache Hive中的數據。社區文檔介紹： https://spark.apache.org/docs/lates

jopen 2014-12-01 18689 0

Spark SQL 分布式/云計算/大數據

P1

memory, use combiner? use compression? pig latin, Hive　簡單語法 HBase, zookeeper 搭建最新：關注cloudera, hortonworks

wujiuliu 2013-05-31 7460 0

Hadoop 分布式/云計算/大數據

O’Grady）表示：「每多一項數據處理工具對Hadoop都有好處……從寫MapReduce程式到支援SQL語法的Hive或Pig等套件，每項工具都讓數據處理更有效率。」所有大數據都該放入Hadoop嗎？這

dy223 2015-03-26 12892 0

大數據

P29

distributed Data Warehouse 騰訊海量數據處理平臺的核心部件基于開源軟件hadoop和hive，大量的優化和改造 7. TDW特性列表（部分）特性說明存儲和計算天然容災集群中個別節點down

andyxiemu 2012-08-13 1111 0

分布式/云計算/大數據方案 SQL

P21

的大數據分析軟件——InfoSphere BigInsights，包括基礎版和企業版。 2010年9月，Hive( Facebook) 脫離Hadoop，成為Apache頂級項目。 2010年9月，Pig脫離

altila 2012-06-12 745 0

Hadoop 分布式/云計算/大數據方案報告 Apache

接入需要解決如下幾個問題：異構數據源適配（要支持MySQL、SQLServer、Oracle、Hive、Hbase、文件MongoDB等之間相互數據搬運），各種數據庫日志協議的解析，格式的統一，分

jopen 2015-12-18 33498 0

架構

Puppet管理集群，之后由于業務需要，又自行開發了Taurus調度系統。并于2012年數據庫倉庫轉向Hadoop/Hive。在2013年建立主要的大數據架構后，大眾點評上線了HBase應用，并引入Spark/Shar

jopen 2015-10-14 38763 0

大眾

雖然上述四個模塊構成了Hadoop的核心，不過還有其他幾個模塊。這些模塊包括：Ambari、Avro、Cassandra、Hive、 Pig、Oozie、Flume和Sqoop，它們進一步增強和擴展了Hadoop的功能，得以擴大到大數據應用領域，處理龐大數據集。

jopen 2016-03-09 8767 0

Spark Hadoop

還開發了一個豐富多樣的應用程序生態系統，包括 Apache Pig（一種強大的腳本語言）和 Apache Hive（一個具有類似 SQL 界面的數據倉庫解決方案）。不幸的是，這個生態系統構建于一種編程模式

jopen 2014-10-09 24967 0

分布式/云計算/大數據 Hadoop YARN

存儲這類數據的方法一般可以分為三類傳統關系型數據庫，如MySQL, PostgreSQL Hadoop HDFS + Hive 數據倉庫，如Amazon Redshift, Microsoft SQL Server for

jopen 2014-12-17 18144 0

存儲

與集群順暢協作。大數據痛點六號：分布式名不副實我得承認，我對Hadoop的第一印象就是在Hive當中輸入select count(*) from somesmalltable。我覺得這種使用方

jopen 2015-08-10 15908 0

大數據

P25

向列的數據庫，僅能通過主鍵(row key)和主鍵的range來檢索數據，僅支持單行事務(可通過hive支持來實現多表join等復雜操作)。主要用來存儲非結構化和半結構化的松散數據。其存儲的每個值都有

xfei365 2014-01-03 623 0

NoSQL數據庫報告 SQL

P39

孢季孤孥學孧孨孩孿孫孬孭孮孯 5b70 孰孱孲孳孴孵孶孷學孹孺孻孼孽孾孿 5b80 宀寧宂它宄宅宆宇守安宊宋完宍宎宏

cyaniso 2013-12-11 2195 0

park等計算引擎頂層——基于MapReduce、Spark等計算引擎的高級封裝及工具，如Hive、Pig、Mahout等等存儲層 HDFS已經成為了大數據磁盤存儲的事實標準，用于海量日志

jopen 2016-03-10 25303 1

Hadoop

Netflix發布Genie3 資訊

Hortonworks宣布一款Hadoop數據平臺資訊

LinkedIn開源大數據計算引擎Cubert，并為此創建新的語言資訊

《2016數據科學從業者薪酬調查報告》摘要解讀文檔

青云QingCloud上線分布式關系型數據庫PolonDB 資訊

淘寶 Hadoop 數據分析實踐文檔

Spark SQL 代碼簡要閱讀（基于Spark 1.1.0）經驗

hadoop面試小結文檔

大數據處理一定需要Hadoop嗎？資訊

海量數據處理的大殺器 - 騰訊分布式數據倉庫(TDW) 文檔

云計算架構 Hadoop 文檔

彥偉：京東實時數據平臺架構設計與實現思路資訊

美團大眾點評合并：背后技術力量的對比回顧資訊

別再比較Hadoop和Spark了，那不是設計人員的初衷資訊

Hadoop YARN的發展史與詳細解析經驗

用戶事件的存儲與分析經驗

頑疾反復發作：大數據技術領域的九大痛點資訊

NoSQL 研究及選型報告文檔

unicode 編碼表文檔

一篇文看懂Hadoop：風雨十年，未來何去何從資訊

Hive學習筆記的相關搜索

關鍵詞

Netflix發布Genie3 資訊

Hortonworks宣布一款Hadoop數據平臺 資訊

LinkedIn開源大數據計算引擎Cubert，并為此創建新的語言 資訊

《2016數據科學從業者薪酬調查報告》摘要解讀 文檔

青云QingCloud上線分布式關系型數據庫PolonDB 資訊

淘寶 Hadoop 數據分析實踐 文檔

Spark SQL 代碼簡要閱讀（基于Spark 1.1.0） 經驗

hadoop面試小結 文檔

大數據處理一定需要Hadoop嗎？ 資訊

海量數據處理的大殺器 - 騰訊分布式數據倉庫(TDW) 文檔

云計算架構 Hadoop 文檔

彥偉：京東實時數據平臺架構設計與實現思路 資訊

美團大眾點評合并：背后技術力量的對比回顧 資訊

別再比較Hadoop和Spark了，那不是設計人員的初衷 資訊

Hadoop YARN的發展史與詳細解析 經驗

用戶事件的存儲與分析 經驗

頑疾反復發作：大數據技術領域的九大痛點 資訊

NoSQL 研究及選型報告 文檔

unicode 編碼表 文檔

一篇文看懂Hadoop：風雨十年，未來何去何從 資訊

Hive學習筆記 的相關搜索

關鍵詞