開源項目,開源代碼,開源文檔,開源新聞,開源社區

Hadoop完全分布式模式的安裝和配置

jopen 2013-11-25 33355 0

Minos是小米hadoop團隊自主研發的hadoop布署、監控系統。它起初被開發和用于部署與管理小米公司中的Hadoop, HBase 和 ZooKeeper集群。Minos可以很容易地擴展，以支持其他系統包括：HDFS, YARN 和 Impala。

jopen 2013-09-15 59382 0

Minos 分布式/云計算/大數據

Apache Hadoop于2005年推出，提供了核心的MapReduce處理引擎來支持大規模數據工作負載的分布式處理。7年后的今天，Hadoop正在經歷著一次徹底檢查，不僅支持MapReduce，還支持其他分布式處理模型。

jopen 2014-10-09 24967 0

分布式/云計算/大數據 Hadoop YARN

Hadoop已經通過自身的蓬勃發展證明，它不僅僅是一套用于將工作內容傳播到計算機群組當中的小型堆棧--不，這與它的潛能相比簡直微不足道。這套核心的價值已經被廣泛證實，目前大量項目如雨后春筍般圍繞它建立起來。有些項目負責數據管理、有些負責流程監控、還有一些則提供先進的數據存儲機制。

jopen 2015-03-19 29675 0

Hadoop 分布式/云計算/大數據

這個 Spark Streaming 樣例是一個可持久化到Hadoop近實時會話的很好的例子。 Spark Streaming 是Apache Spark 中最有趣的組件之一。你用Spark Streaming可以創建數據管道來用批量加載數據一樣的API處理流式數據。此外，Spark Steaming的“micro-batching”方式提供相當好的彈性來應對一些原因造成的任務失敗。

jopen 2015-06-22 21976 0

Spark Hadoop 分布式/云計算/大數據

繼云計算之后，大數據(Big Data)接棒成為最熱門的科技潮字，和大數據有關的技術和科技接二連三成為科技圈注目的焦點。如果你也關注云端跟大數據的資訊，Hadoop 這個字出現頻率一定挺高的，這個黃色小象 Logo 也應該經常亮相。

jopen 2015-03-13 25945 0

Hadoop 分布式/云計算/大數據

Hadoop yarn完全分布式安裝筆記

jopen 2015-05-27 19313 0

Hadoop 分布式/云計算/大數據

HDFS是Hadoop Distribute File System 的簡稱，也就是Hadoop分布式文件系統。

fdwm 2015-04-19 17745 0

HDFS 分布式/云計算/大數據

新世紀以來，互聯網及個人終端的普及，傳統行業的信息化及物聯網的發展等產業變化產生了大量的數據，遠遠超出了單臺機器能夠處理的范圍，分布式存儲與處理成為唯一的選項。從2005年開始，Hadoop從最初Nutch項目的一部分，逐步發展成為目前最流行的大數據處理平臺。Hadoop生態圈的各個項目，圍繞著大數據的存儲，計算，分析，展示，安全等各個方面，構建了一個完整的大數據生態系統，并有Cloudera，HortonWorks，MapR等數十家公司基于開源的Hadoop平臺構建自己的商業模式，可以認為是最近十年來最成功的開源社區。

jopen 2015-09-26 32975 0

Hadoop 分布式/云計算/大數據

網上教程有很多關于Hadoop配置的，但是每一個教程都對應了一個版本信息，有一些教程也存在很大的問題，配置環境，系統環境都沒說清楚。在此我將記錄下來從零搭建Hadoop2.7.1的過程，以及搭建過程中所遇到的一些問題。

jopen 2016-01-18 29490 0

分布式/云計算/大數據

P39

該文檔從源代碼的級別剖析了Hadoop 0.20.2版本的MapReduce模塊的運行原理和流程，對JobTracker、TaskTracker的內部結構和交互流程做了詳細介紹。系統地分析了Map程序和Reduce程序運行的原理。讀者在閱讀之后會對Hadoop MapReduce 0.20.2版本源代碼有一個大致的認識。

songyl525 2013-12-11 465 0

Hadoop 分布式/云計算/大數據

HBase是 Hadoop中的一個簡單數據庫。它與Google的Bigtable特別相似，但也存在許多的不同之處。數據模型 HBase數據庫使用了和 Bigtable非常相似的數據模型。用戶在表格里存儲許多數據行。每個數據行都包括一個可排序的關鍵字，和任意數目的列。表格是稀疏的，所以同一個表格里的行可能有非常不同的列，只要用戶喜歡這樣做。列名是“<族名>:<標簽>”形式，其中<族名>和<

Hadoopp 2012-09-28 1184 0

CCleaner IcAROS Desktop

作者 Scott Delap 譯者 Terry Hadoop 是一個開源的分布式計算平臺，它主要由MapReduce的算法執行和一個分布式的文件系統等兩部分組成。InfoQ曾經刊登過一篇Jeremy Zawodny寫的有關Hadoop速度提升的綜述性文章。這次InfoQ的資深Java編輯Scott Delap和Hadoop項目負責人Doug Cutting進行了一次專訪。在這次InfoQ的

Hadoopp 2012-09-28 840 0

Google I/O Nexus 6 Window 10

P30

MapReduce已經開始顯現老化的跡象，局限性越來越明顯。Tez作為下一代hadoop的執行引擎與傳統的MapReduce相比做了很大的改進和優化，將計算模型直接建立在DAG上面，比傳統的MapReduce更加直接，靈活，在性能上有很大的提升。同時由于Tez從項目開始就集成了Yarn，從而對于整個計算資源的Context了解的更加清楚，這也有助于性能的優化。本次演講將主要對Tez做一個Overview的介紹。

dfwm 2014-10-19 763 0

分布式/云計算/大數據 Apache Java Scala Go

Sqoop是一個用于將Hadoop與關系型數據庫中的數據相互轉移的工具，可以將一個關系型數據庫（例如： MySQL ,Oracle ,Postgres等）中的數據導入到Hadoop的HDFS中，也可以將HDFS的數據導入到關系型數據庫中。 Hadoop 并不僅僅是一個用于存儲的分布式文件系統，而是設計用來在由通用計算設備組成的大型集群上執行分布式應用的框架。 Hadoop相關文檔。收錄時間：

碼頭工人 2019-01-17 737 0

其它開源項目

P13

Cloudera Manager介紹和安裝ClouderaManager（簡稱CM）用于管理CDH4集群，可進行節點安裝、配置、服務配置等，提供Web窗口界面提高了Hadoop配置可見度，而且降低了集群參數設置的復雜度。

玫瑰情書 2014-06-18 693 0

Hadoop 分布式/云計算/大數據 x86 SQL

原文  http://www.chinacloud.cn/show.aspx?id=19488&cid=12 Hadoop并不完全代表云計算，所以，要用Hadoop搭建完整的云計算平臺，答案是不夠。我們常說云計算，實際上還是通過計算機的大規模或者說海量處理來為生活中各式各樣的人和各行各業服務——所以，核心在“服務”。關于服務，展開來就是常

jopen 2015-03-18 14267 1

Hadoop ci 云計算 C/C++ SQL

在網絡流量的分析中，基于流的分析被大多數ISP所采用，分析系統一般部署在一臺高配置的服務器中。如由CERT網絡勢態感知團隊(CERT-NetSA)開發的用于大規模網絡安全分析的網絡交互分析工具集 SILK(the System for Internet-Level Knowledge)，支持有效的收集、存儲和分析網絡流數據，SILK可以高效地查詢歷史大流量數據集

jopen 2015-07-30 14958 0

Hadoop 分布式/云計算/大數據

Apache Eagle Committer 和 PMC 成員，eBay 分析平臺基礎架構部門高級軟件工程師，負責Eagle的產品設計、技術架構、核心實現以及開源社區推廣等。

jopen 2016-01-06 30988 0

Hadoop 開源分布式/云計算/大數據

現在Hadoop已經發展成為包含多個子項目的集合。雖然其核心內容是MapReduce和Hadoop分布式文件系統(HDFS)，但Hadoop下的Common、Avro、Chukwa、Hive、HBase等子項目也是不可或缺的。它們提供了互補性服務或在核心層上提供了更高層的服務。

jopen 2016-01-18 18790 0

分布式/云計算/大數據

Hadoop完全分布式模式的安裝和配置經驗

小米研發的hadoop布署、監控系統：Minos 經驗

Hadoop YARN的發展史與詳細解析經驗

十八款Hadoop工具幫你馴服大數據經驗

怎樣利用Spark Streaming和Hadoop實現近實時的會話連接經驗

一篇文章讀懂大數據的黃色小象幫手––Hadoop 經驗

Hadoop yarn完全分布式安裝筆記經驗

Hadoop分布式文件系統HDFS介紹經驗

脫離JVM？Hadoop生態圈的掙扎與演化經驗

從零開始搭建Hadoop2.7.1的分布式集群經驗

Hadoop MapReduce 模塊源代碼詳細解析文檔

詳細講解Hadoop中的一個簡單數據庫HBase 博客

雅虎架構師談MapReduce和Hadoop的未來博客

Tez - 下一代Hadoop上的執行引擎文檔

關系數據庫與Hadoop數據遷移工具 Sqoop 開源項目

hadoop開發案例之Cloudera Manager詳解文檔

能否利用Hadoop搭建完整的云計算平臺？問答

基于Hadoop的大規模網絡流量分析經驗

Apache Eagle：eBay開源分布式實時Hadoop數據安全引擎經驗

Hadoop主要子項目介紹（Pig Zookeeper Hbase Hive Sqoop Avro Chukwa Cassandra ）經驗

Ubuntu安裝hadoop 的相關搜索

關鍵詞

Hadoop完全分布式模式的安裝和配置 經驗

小米研發的hadoop布署、監控系統：Minos 經驗

Hadoop YARN的發展史與詳細解析 經驗

十八款Hadoop工具幫你馴服大數據 經驗

怎樣利用Spark Streaming和Hadoop實現近實時的會話連接 經驗

一篇文章讀懂大數據的黃色小象幫手––Hadoop 經驗

Hadoop yarn完全分布式安裝筆記 經驗

Hadoop分布式文件系統HDFS介紹 經驗

脫離JVM？Hadoop生態圈的掙扎與演化 經驗

從零開始搭建Hadoop2.7.1的分布式集群 經驗

Hadoop MapReduce 模塊源代碼詳細解析 文檔

詳細講解Hadoop中的一個簡單數據庫HBase 博客

雅虎架構師談MapReduce和Hadoop的未來 博客

Tez - 下一代Hadoop上的執行引擎 文檔

關系數據庫與Hadoop數據遷移工具 Sqoop 開源項目

hadoop開發案例 之Cloudera Manager詳解 文檔

能否利用Hadoop搭建完整的云計算平臺？ 問答

基于Hadoop的大規模網絡流量分析 經驗

Apache Eagle：eBay開源分布式實時Hadoop數據安全引擎 經驗

Hadoop主要子項目介紹（Pig Zookeeper Hbase Hive Sqoop Avro Chukwa Cassandra ） 經驗

Ubuntu安裝hadoop 的相關搜索

關鍵詞

Hadoop完全分布式模式的安裝和配置經驗

Hadoop YARN的發展史與詳細解析經驗

十八款Hadoop工具幫你馴服大數據經驗

怎樣利用Spark Streaming和Hadoop實現近實時的會話連接經驗

Hadoop yarn完全分布式安裝筆記經驗

Hadoop分布式文件系統HDFS介紹經驗

脫離JVM？Hadoop生態圈的掙扎與演化經驗

從零開始搭建Hadoop2.7.1的分布式集群經驗

Hadoop MapReduce 模塊源代碼詳細解析文檔

雅虎架構師談MapReduce和Hadoop的未來博客

Tez - 下一代Hadoop上的執行引擎文檔

hadoop開發案例之Cloudera Manager詳解文檔

能否利用Hadoop搭建完整的云計算平臺？問答

基于Hadoop的大規模網絡流量分析經驗

Apache Eagle：eBay開源分布式實時Hadoop數據安全引擎經驗

Hadoop主要子項目介紹（Pig Zookeeper Hbase Hive Sqoop Avro Chukwa Cassandra ）經驗