登錄
注冊
首頁
項目
經驗
代碼
文庫
問答
博客
資訊
分布式/云計算/大數據
(共
1277
篇經驗)
0
推薦
17K
瀏覽
大數據技術棧之配置&發布系統
今天早上一同事微信說奇虎360開源了一套配置管理系統。 地址在這: https://github.com/Qihoo360/QConf 。 正好我們之前也做了一套配管系統,于是點進去看了看,基于...
jopen
10年前
大數據
分布式/云計算/大數據
0
推薦
130K
瀏覽
facebook海量圖片存儲系統與淘寶TFS系統比較
【譯者預讀】面對海量小文件的存儲和檢索,Google發表了GFS,淘寶開源了TFS,而Facebook又是如何應對千億級別的圖片存儲、每秒百萬級別的圖片查詢?Facebook與同樣提供了海量圖片...
jopen
10年前
TFS
存儲系統
分布式/云計算/大數據
0
推薦
23K
瀏覽
Apache Hadoop 2.6.0安裝部署
Apache Hadoop 2.6.0安裝部署
b36g
10年前
Apache Hadoop
分布式/云計算/大數據
0
推薦
34K
瀏覽
Storm是如何成為Apache頂級項目的
Apache Storm是一個免費、開源的分布式實時計算系統,不久前剛剛升級為Apache頂級項目。近日,該項目創建者Nathan Marz撰文回顧了Storm的發展歷史以及相關的經驗教訓。他認...
jopen
10年前
Storm
分布式/云計算/大數據
0
推薦
73K
瀏覽
部署大數據?請參考大數據分析平臺架構(Big Data Analytics Platform)
數據源: 除該種方法之外,還可以分為離線數據、近似實時數據和實時數據。按照圖中的分類其實就是說明了數據存儲的結構,而特別要說的是流數據,它的核心就是數據的連續性和快速分析性;
jopen
10年前
大數據
分布式/云計算/大數據
0
推薦
84K
瀏覽
Spark 偽分布式 & 全分布式 安裝指南
3月31日是 Spark 五周年紀念日,從第一個公開發布的版本開始,Spark走過了不平凡的5年:從剛開始的默默無聞,到13年的鵲起,14年的大爆發。Spark核心之上有分布式的機器學習,SQL...
jopen
10年前
Spark
分布式/云計算/大數據
0
推薦
62K
瀏覽
用Apache Spark進行大數據處理——第一部分:入門介紹
Apache Spark是一個圍繞速度、易用性和復雜分析構建的大數據處理框架。最初在2009年由加州大學伯克利分校的AMPLab開發,并于2010年成為Apache的開源項目之一。 與Hado...
jopen
10年前
Apache Spark
分布式/云計算/大數據
0
推薦
18K
瀏覽
分布式存儲系統事務時序
今天談談分布式事務的時序問題。在說這個問題之前首先說說這為什么是個問題。
yne7
10年前
分布式
分布式/云計算/大數據
0
推薦
9K
瀏覽
linux分布式安裝hadoop1.2
三臺機器,centos6.5, master、slave1、slaver2分布式安裝hadoop1.2
yne7
10年前
Hadoop
分布式/云計算/大數據
0
推薦
17K
瀏覽
Paracel:豆瓣開發的大型分布式計算框架,用于機器學習、圖算法
Paracel是豆瓣開發的一個分布式計算框架,它基于參數服務器范式,最初是為機器學習算法設計的。 Paracel支持數據和模型的并行,為用戶提供簡單易用的通信接口,比mapreduce式的系統要...
yne7
10年前
分布式/云計算/大數據
Paracel
0
推薦
15K
瀏覽
Yelp研發實踐:使用服務拆分單塊應用
Yelp工程師團隊 表示,面對團隊和代碼庫規模不斷增長的情況,他們通過實踐向面向服務架構遷移,得以使開發過程同步具備擴展能力,并且保持了快速的軟件交付。這一切取決于以下因素,包括對團隊灌輸分布式...
cd33
10年前
yelp
分布式/云計算/大數據
0
推薦
38K
瀏覽
Storm筆記
用了一段時間Storm后的筆記。發現可以記的東西不多,證明Storm挺簡單的,你只要遵循一些簡單的接口與原則,就能寫出大規模實時消息處理的程序。
jopen
10年前
Storm
分布式/云計算/大數據
0
推薦
17K
瀏覽
hadoop安裝配置
hadoop安裝配置
jopen
10年前
Hadoop
分布式/云計算/大數據
0
推薦
18K
瀏覽
分布式表格系統:?Tera
Tera 是一個高性能、可伸縮的數據庫系統,被設計用來管理搜索引擎萬億量級的超鏈與網頁信息。為實現數據的實時分析與高效訪問,我們使用按行鍵、列名和時間戳全 局排序的三維數據模型組織數據,使用多級...
cwf8
10年前
分布式/云計算/大數據
?Tera
0
推薦
25K
瀏覽
什么是Storm,它可以用來做什么?
最近團隊中有分析的場景,用到了JStorm來做數據的實時分析,于是花時間對于一些概念做了了解。
jopen
10年前
Storm
分布式/云計算/大數據
0
推薦
14K
瀏覽
Zookeeper工作原理
ZooKeeper 是一個分布式的,開放源碼的分布式應用程序協調服務,它包含一個簡單的原語集,分布式應用程序可以基于它實現同步服務,配置維護和命名服務等。 Zookeeper是hadoop...
jopen
10年前
ZooKeeper
分布式/云計算/大數據
0
推薦
22K
瀏覽
Zookeeper研究和應用
zookeeper是一個開源分布式的服務,它提供了分布式協作,分布式同步,配置管理等功能. 其實現的功能與google的chubby基本一致.zookeeper的官方網站已經寫了一篇非常經典的概...
jopen
10年前
ZooKeeper
分布式/云計算/大數據
0
推薦
22K
瀏覽
hadoop2.5.2HA高可靠性集群搭建(zookeeper3.4.6+hbase0.98.11)
在hadoop2中新的NameNode不再是只有一個,可以有多個(目前只支持2個)。每一個都有相同的職能。 一個是active狀態的,一個是standby狀態的。當集群運行時,只有active...
xmnx
10年前
Hadoop
分布式/云計算/大數據
0
推薦
88K
瀏覽
為什么不應該使用ZooKeeper做服務發現
本文作者通過ZooKeeper與Eureka作為 Service發現服務(注:WebServices 體系中的UDDI就是個發現服務)的優劣對比,分享了Knewton在云計算平臺部署服務的經驗。...
jopen
10年前
ZooKeeper
分布式/云計算/大數據
0
推薦
38K
瀏覽
Spark RDD API詳解(一) Map和Reduce
RDD是Spark中的抽象數據結構類型,任何數據在Spark中都被表示為RDD。從編程的角度來看,RDD可以簡單看成是一個數組。和普通數組 的區別是,RDD中的數據是分區存儲的,這樣不同分區的數...
jopen
10年前
Spark
分布式/云計算/大數據
1
2
3
4
5
6
7
8
9
10
經驗分享,提升職場影響力
投稿
熱門問答
熱門文檔
sesese色