登錄
注冊
首頁
項目
經驗
代碼
文庫
問答
博客
資訊
分布式/云計算/大數據
(共
1277
篇經驗)
0
推薦
17K
瀏覽
Storm集群的DRPC模式
storm的DRPC模式的作用是實現從遠程調用storm集群的計算資源,而不需要連接到集群的某一個節點。OK。那么storm實現DRPC主要是 使用LinearDRPCTopologyBuilder這個類
jopen
10年前
Storm
分布式/云計算/大數據
0
推薦
18K
瀏覽
ZooKeeper偽分布式集群安裝
獲取ZooKeeper安裝包 下載地址:http://apache.dataguru.cn/zookeeper 選擇一個穩定版本進行下載,我這里下載的是zookee...
jopen
10年前
ZooKeeper
分布式/云計算/大數據
0
推薦
35K
瀏覽
實時大數據分析平臺:Ebay Pulsar
Pulsar 是 eBay 開源的實時大數據分析平臺。 作為全球性的商務平臺和支付行業領先者,擁有海量的用戶行為數據。 基于現有的hadoop大數據處理,已經不能夠滿足業務上對實時性的需...
jopen
10年前
分布式/云計算/大數據
Ebay Pulsar
0
推薦
64K
瀏覽
Zookeeper的Java客戶端
zookeeper是一個分布式的,開放源碼的分布式應用程序協調服務,是Google的Chubby一個開源的實現,是Hadoop和Hbase的重要組件。它是一個為分布式應用提供一致性服務的軟件,由...
jopen
10年前
ZooKeeper
分布式/云計算/大數據
0
推薦
38K
瀏覽
配置高可用的Hadoop平臺
在Hadoop2.x之后的版本,提出了解決單點問題的方案--HA(High Available 高可用)。這篇博客闡述如何搭建高可用的HDFS和YARN
jopen
10年前
Hadoop
分布式/云計算/大數據
0
推薦
18K
瀏覽
分布式計算系統:Onyx
Onyx 是一個無中心、支持云、容錯的分布式計算系統 使用 Clojure 編寫
jopen
10年前
Onyx
分布式/云計算/大數據
0
推薦
16K
瀏覽
大規模Docker集群助力微博迎接春晚峰值挑戰
羊年的春晚與往年的春晚一樣,卻又不太一樣。一樣的是服務器君仍要應對全民“DDOS攻擊”,不一樣的是今年無法通過簡單的擴容抵御峰值。今年不但主信息流日常用戶活躍度已經達到了去年春晚的峰值,同時渣浪...
jopen
10年前
Docker
分布式/云計算/大數據
0
推薦
46K
瀏覽
如何挑選合適的大數據或Hadoop平臺?
IBM、Oracle、SAP、甚至Microsoft等幾乎所有的大型軟件提供商都采用了Hadoop。然而,當你已經決定要使用Hadoop來處理大數據時,首先碰到的問題就是如何開始以及選擇哪一種產...
jopen
10年前
Hadoop
分布式/云計算/大數據
0
推薦
36K
瀏覽
介紹兩款大數據清洗工具 - DataWrangler、Google Refine
在進行數據分析和可視化之前,經常需要先“清洗”數據。這意味著什么?可能有些詞條列表里是“New York City”,而其他人寫成“New York, NY”。然而,你在看到某些模式前得將各種各...
wc7n
10年前
分布式/云計算/大數據
DataWrangler
0
推薦
40K
瀏覽
Spark on Yarn: Cluster模式Scheduler實現
Spark on Yarn分yarn-cluster和yarn-client兩種模式。 本文通過Cluster模式的TaskScheduler實現入手,梳理一遍spark on yarn的大致實現邏輯。
c6g3
10年前
Spark
分布式/云計算/大數據
0
推薦
14K
瀏覽
Hadoop初步體驗(安裝與測試)
簡述:Hadoop是最著名使用最廣泛的分布式大數據處理框架,它是用Java開發的。 物理主機、虛擬機、虛擬主機這三個就不多說了。我們先在ubuntu里添加一個叫hadoop的用戶
jopen
10年前
Hadoop
分布式/云計算/大數據
0
推薦
21K
瀏覽
Spark on Mesos: 粗粒度與細粒度實現分析
順著昨天spark standalone實現那篇文章繼續扯淡,看看Mesos Scheduler的兩種實現的異同。 對我來說,回過頭再仔細看Spark在這一層的實現,思路又清晰了許多。
jopen
10年前
Spark
分布式/云計算/大數據
0
推薦
14K
瀏覽
梳理對Spark Standalone的理解
本文不打算從源碼分析的角度看standalone如何實現,甚至有的模塊和類在分析中都是忽略掉的。 本文目的是透過spark的standalone模式,看類似spark這種執行模式的系統,...
jopen
10年前
Spark
分布式/云計算/大數據
0
推薦
29K
瀏覽
Hadoop安裝部署
使用VirtualBox安裝CentOS6.4,存儲為30G,內存為1G,并使用復制克隆出兩個新的虛擬機,這樣就存在3臺虛擬機,設置三臺虛擬機的主機名稱,如:master、slaver1、slaver2
ymc4
10年前
Hadoop
分布式/云計算/大數據
0
推薦
21K
瀏覽
最夯的大數據分析工具-Apache Spark
大家好!我是貓大,大家還記得我的好友咪咪(那位想要知道自己養的貓,會不會抓老鼠的那位愛貓人士)嗎?在過去文章什么 ? SVM會賺錢 !中貓大介紹了SVM的概念,以及如何通過LIBSVM,幫助使用...
jopen
10年前
Apache Spark
分布式/云計算/大數據
0
推薦
98K
瀏覽
使用Ceph作為OpenStack的后端存儲
libvirt配置了librbd的QEMU接口,通過它可以在OpenStack中使用Ceph塊存儲。Ceph塊存儲是集群對象,這意味著它比獨立的服務器有更好的性能。 在Ope...
jopen
10年前
OpenStack
分布式/云計算/大數據
0
推薦
54K
瀏覽
6個用于大數據分析的最好工具
大數據是一個含義廣泛的術語,是指數據集,如此龐大而復雜的,他們需要專門設計的硬件和軟件工具進行處理。該數據集通常是萬億或EB的大小。這些 數據集收集自各種各樣的來源:傳感器,氣候信息,公開的...
jopen
10年前
工具
分布式/云計算/大數據
0
推薦
20K
瀏覽
Spotify如何對Apache Storm進行規模擴展
【編者的話】Spotify是一家音樂流媒體服務商,最新的數據顯示他們已經有6000萬用戶。 Spotify內部使用 Apache Storm來構建實時類系統,包括廣告定位、音樂推薦以及數據可視化...
jopen
10年前
Apache Storm
分布式/云計算/大數據
0
推薦
49K
瀏覽
大數據的OLAP技術
和企業私有云的架構一樣,對企業的大數據平臺,我們很難直接去簡單復制互聯網的海量存儲或計算平臺技術,如Hadoop、HBase、 Spark;因為這些技術搭建的只是一個數據的基礎設施,要在傳統企業...
jopen
10年前
OLAP
分布式/云計算/大數據
0
推薦
61K
瀏覽
Flume-ng的原理和使用
Flume 是 Cloudera 提供的日志收集系統,具有分布式、高可靠、高可用性等特點,對海量日志采集、聚合和傳輸,Flume 支持在日志系統中定制各類數據發送方,同時,Flume提供對數據進...
jopen
10年前
Flume
分布式/云計算/大數據
1
2
3
4
5
6
7
8
9
10
經驗分享,提升職場影響力
投稿
熱門問答
熱門文檔
sesese色