開源項目,開源代碼,開源文檔,開源新聞,開源社區_深度開源

P

Hadoop是一個分布式系統基礎架構，由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下，開發分布式程序。充分利用集群的威力高速運算和存儲。簡單地說來，Hadoop是一個可以更容易開發和運行處理大規模數據的軟件平臺。 Hadoop實現了一個分布式文件系統（Hadoop Distributed File System），簡稱HDFS。HDFS有著高容錯性（fault-tolerent）的特點，并且設計用來部署在低廉的（low-cost）硬件上。而且它提供高傳輸率（high throughput）來訪問應用程序的數據，適合那些有著超大數據集（large data set）的應用程序。HDFS放寬了（relax）POSIX的要求（requirements）這樣可以流的形式訪問（streaming access）文件系統中的數據。

perfectqgw 2012-11-18 3212 0

Hadoop 分布式/云計算/大數據

P

Hadoop是一個分布式系統基礎架構，由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下，開發分布式程序。充分利用集群的威力高速運算和存儲。簡單地說來，Hadoop是一個可以更容易開發和運行處理大規模數據的軟件平臺。Hadoop實現了一個分布式文件系統（Hadoop Distributed File System），簡稱HDFS。HDFS有著高容錯性（fault-tolerent）的特點，并且設計用來部署在低廉的（low-cost）硬件上。而且它提供高傳輸率（high throughput）來訪問應用程序的數據，適合那些有著超大數據集（large data set）的應用程序。HDFS放寬了（relax）POSIX的要求（requirements）這樣可以流的形式訪問（streaming access）文件系統中的數據。

wanjia19 2011-08-10 6182 0

Hadoop 分布式/云計算/大數據

P3

?Hadoop任務調度在Master上運行的是JobTracker守護進程，而在Slave上運行的是TaskTracker守護進程。對于一個作業，首先提交給JobTracker，再由JobTracker對提交的作業進行處理。

thinkingx 2011-12-15 5872 0

Hadoop 分布式/云計算/大數據

P2

?Hadoop API組成 Hadoop API被分成（divide into）如下幾種主要的包（package）序號名稱說明 1. org.apache.hadoop.conf 定義了系統參數的配置文件處理API。

willfly 2011-08-28 4194 0

Hadoop 分布式/云計算/大數據

P7

所有的Hadoop命令均由bin/hadoop腳本引發。不指定參數運行hadoop腳本會打印所有命令的描述。 The general command line syntax is: hadoop [--config

xfj3526 2012-06-13 3684 0

Hadoop 分布式/云計算/大數據

P41

?Hadoop Map/Reduce教程[一] 編輯 | 刪除 | 權限設置 | 更多▼ 更多▲ · 設置置頂 · 推薦日志 · 轉為私密日志開心延年 ?? 發表于2009年11月02日 00:15

wentao 2012-02-03 2837 0

Hadoop 分布式/云計算/大數據

P50

科技改變生活! 思數科技集群部署入門修訂記錄日期修改原因描述作者 2012/02/14 初稿 Hadoop部署文檔 2012/07/14 完善細節新基礎環境配置,修改配置文件,修改架構圖。 2012/07/16

ka520 2015-11-14 434 0

Hadoop 分布式/云計算/大數據手冊

一、Hadoop Streaming 它是hadoop的一個工具，用來創建和運行一類特殊的map/reduce作業。所謂的特殊的map/reduce作業可以是可執行文件或腳本本件（python、P

jopen 2011-12-21 55545 0

Hadoop 分布式/云計算/大數據

概述所有的hadoop命令均由bin/hadoop腳本引發。不指定參數運行hadoop腳本會打印所有命令的描述。用法：hadoop [--config confdir] [COMMAND]

jopen 2012-02-01 4317 0

P27

發現異常 MapReduce 參與計算角色窺探 JOB 運行 MR 提供重寫接口配置參數調優 Hadoop 組成 3. HDFS 文件系統 4. HDFS 什么是文件系統文件系統：操作系統用于明確磁盤或分區上的文件的方法和數據結構；

gppxm 2012-10-19 2076 0

Hadoop 分布式/云計算/大數據報告

P35

1. Hadoop入門盧學裕@優酷網 2012.07 2. OutlinesHadoop Overview HDFS Map-reduce Programming Paradigm Hadoop Map-reduce

也許那樣飛 2016-01-15 2782 0

分布式/云計算/大數據

P49

1. Lecture 11 – Hadoop Technical Introduction 2. TerminologyGoogle calls it:Hadoop equivalent:MapRed

Eric_V72 2013-10-20 347 0

Hadoop 分布式/云計算/大數據 x86 Java Go

如果覺得有幫助的話就頂下吧在統計的時候經常會用到排重，比如想統計每日登陸用戶，但是一個用戶一次多次登陸情況，或者一個產品被多少個用戶下載。。

ygp8 2015-09-05 6606 0

Hadoop 分布式/云計算/大數據

im/2016/03/05/hadoop-101/ Hadoop 2.0 架構 Hadoop 包括如下幾個模塊： Hadoop Common：公共基礎組件； Hadoop Distributed File

JaquelineEc 2016-03-04 22471 0

Hadoop 分布式系統分布式/云計算/大數據

讓hive支撐在hbase數據庫層面的 hql查詢.hive也即做數據倉庫 1. 基于Hadoop+Hive架構對海量數據進行查詢：http://blog.csdn.net/kunshan_s

jopen 2012-02-04 180500 0

Hadoop 分布式/云計算/大數據

Hadoop集群配置部分參數：設置dfs.name.dir 時，通過逗號分隔多個值，可以使namenode將元數據存儲到多個副本，以便namenode出錯時恢復。 dfs.data.dir也可設

jopen 2014-01-28 18751 0

Hadoop 分布式/云計算/大數據

啟動Hadoop 進入HADOOP_HOME 目錄。執行 sh bin/start-all.sh 關閉Hadoop 進入HADOOP_HOME目錄。執行sh bin/stop-all.sh

jopen 2014-10-29 16967 0

Hadoop 分布式/云計算/大數據

2 安裝準備創建hadoop用戶使用專有用戶進行相關操作 # 創建hadoop用戶組 groupadd hadoop # 創建hadoop用戶 useradd hadoop # 設置密碼 passwd

ymc4 2015-02-11 28859 0

Hadoop 分布式/云計算/大數據

簡介 HDFS （Hadoop Distributed File System ）Hadoop分布式文件系統。是根據google發表的論文翻版的。論文為GFS（Google File System）Google

wdey 2015-05-24 13886 0

HDFS 分布式/云計算/大數據

P10

?Hadoop包括hdfs與mapreduce兩部分，在使用期期間我主要看了mapreduce部分，即hadoop執行作業的部分。 1. mapreduce中幾個主要的概念 mapreduce整體上可

szx85307 2012-05-28 2711 0

Hadoop 分布式/云計算/大數據

K-means Hadoop 的相關搜索

1 2 3 4 5 6 7 8 9 10

關鍵詞

Spring Apache Hadoop 5.2.1版本發布 Basic Zeppelin Eclipse開發工具分布式/云計算/大數據 ini Diff

sesese色