登錄
注冊
首頁
項目
經驗
代碼
文庫
問答
博客
資訊
分布式/云計算/大數據
(共
1277
篇經驗)
0
推薦
53K
瀏覽
“Ceph淺析”系列之(三)—Ceph的結構
本文將從邏輯結構的角度對Ceph進行分析。
jopen
10年前
Ceph
存儲系統
分布式/云計算/大數據
0
推薦
36K
瀏覽
“Ceph淺析”系列之(二)—Ceph的設計思想
分析開源項目,時常遇到的一個問題就是資料不足。有時間寫代碼的大牛們通常是都是沒有時間或者根本不屑于寫文檔的。而不多的文檔通常又是使用手冊之類的東西。即便偶爾有設計文檔通常也是語焉不詳。在...
jopen
10年前
Ceph
存儲系統
分布式/云計算/大數據
0
推薦
64K
瀏覽
“Ceph淺析”系列之(—)—Ceph概況
本文將對Ceph的基本情況進行概要介紹,以期讀者能夠在不涉及技術細節的情況下對Ceph建立一個初步印象。
jopen
10年前
Ceph
存儲系統
分布式/云計算/大數據
0
推薦
25K
瀏覽
Kubernetes – Google分布式容器技術初體驗
Kubernetes是Google開源的容器集群管理系統。前幾天寫的 分布式服務框架的4項特性 中提到一個良好的分布式服務框架需要實現
jopen
10年前
Kubernetes
分布式/云計算/大數據
0
推薦
37K
瀏覽
內存計算技術那家強?SPARK vs HANA
最近業界有很多技術和產品都認為屬于內存計算的范疇,由于我個人也從事于內存計算產品的研發,所以想借個機會,跟各位聊聊到底什么是內存計算技術,以及比較一些現在兩種比較主流的內存計算技術Apache ...
jopen
10年前
Spark
分布式/云計算/大數據
0
推薦
47K
瀏覽
Hadoop中MapReduce框架入門
MapReduce是一種分布式計算模型,由Google提出,主要用于搜索領域,解決海量數據的計算問題.對于業 界的大數據存儲及分布式處理系統來說Hadoop2提出的新MapReudce就是YA...
jopen
10年前
MapReduce
分布式/云計算/大數據
0
推薦
31K
瀏覽
Hive實戰之日志分析
本文主要講述使用 hive 的實踐,業務不是關鍵,簡要介紹業務場景,本次的任務是對搜索日志數據進行統計分析。 集團搜索剛上線不久,日志量并不大 。這些日志分布在 5 臺前端機,按小時保存,并以...
jopen
10年前
Hive
分布式/云計算/大數據
0
推薦
37K
瀏覽
Hive學習的思維導圖
Hive學習的思維導圖
jopen
10年前
Hive
分布式/云計算/大數據
0
推薦
16K
瀏覽
pig學習筆記
Pig是一種探索大規模數據集的腳本語言。 pig是在HDFS和MapReduce之上的數據流處理語言,它將數據流處理翻譯成多個map和reduce函數,提供更高層次的抽象將程序員從具體的編
jopen
10年前
分布式/云計算/大數據
Pig
0
推薦
109K
瀏覽
Spark介紹
Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的并行計算框架,Spark基于map reduce算法實現的分布式計算,擁有Hadoop Map...
jopen
10年前
Spark
分布式/云計算/大數據
0
推薦
29K
瀏覽
Oozie的學習筆記
在Hadoop中執行的任務有時候需要把多個Map/Reduce作業連接到一起,這樣才能夠達到目的。[1]在Hadoop生態圈中,有一種相對比較 新的組件叫做Oozie[2],它讓我...
jopen
10年前
分布式/云計算/大數據
Oozie
0
推薦
50K
瀏覽
Hadoop DistributedCache分布式緩存的使用
做項目的時候遇到一個問題,在Mapper和Reducer方法中處理目標數據時,先要去檢索和匹配一個已存在的標簽庫,再對所處理的字段打標簽。因為標簽庫不是很大,沒必要用HBase。我的實現方法是把...
jopen
10年前
緩存
分布式/云計算/大數據
0
推薦
138K
瀏覽
使用 RMI + ZooKeeper 實現遠程調用框架
本文先從通過一個最簡單的 RMI 服務與調用示例,讓讀者快速掌握 RMI 的使用方法,然后指出 RMI 的局限性,最后筆者對此問題提供了一種簡單的解決方案,即使用 ZooKeeper 輕松解決 ...
jopen
10年前
ZooKeeper
分布式/云計算/大數據
0
推薦
32K
瀏覽
Apache Curator 簡介
Curator提供了一套Java類庫, 可以更容易的使用ZooKeeper。 ZooKeeper本身提供了Java Client的訪問類,但是API太底層,不宜使用, 容易出錯。 Curator...
jopen
10年前
Apache Curator
分布式/云計算/大數據
0
推薦
16K
瀏覽
MapReduce的組合式,迭代式,鏈式
1.比如我們輸出的mapreduce結果,需要進入下一個mapreduce,該怎么解決?可以使用迭代式 2.那么什么是迭代式? 3.什么是依賴式? 4.什么是鏈式? 5.三種模式各自的應用場景是什么?
jopen
10年前
MapReduce
分布式/云計算/大數據
0
推薦
21K
瀏覽
開源的云管理平臺:SmartDataCenter (SDC)
SmartDataCenter (SDC) 是一個開源的云管理平臺,提供下一代基于容器、面向服務架構的多數據庫中心管理。其重點是為了簡化安裝和管理。目前 Joyent 公有云和很多私有云都使用該...
jopen
10年前
分布式/云計算/大數據
SmartDataCenter
0
推薦
19K
瀏覽
Hive分區
1、在Hive Select查詢中一般會掃描整個表內容,會消耗很多時間做沒必要的工作。有時候只需要掃描表中關心的一部分數據,因此建表時引入了partition概念。
jopen
10年前
Hive
分布式/云計算/大數據
0
推薦
607K
瀏覽
zookeeper簡介
一直對zookeeper的應用和原理比較迷糊,今天看一篇文章,講得很通透,分享如下:
jopen
10年前
ZooKeeper
分布式/云計算/大數據
0
推薦
17K
瀏覽
詳解CloudFoundry中各個組件的作用
CloudFoundry是一個標桿性的項目,架構設計上有很多值得借鑒之處。從CloudFoundry官網摘了一張圖,我們以此剖析各個組件的作用。
jopen
10年前
分布式/云計算/大數據
CloudFoundry
0
推薦
22K
瀏覽
分布式dynamo層:Netflix Dynomite
Dynomite 是 Netflix 的開源作品,靈感來自于 Dynamo whitepaper ,是一個輕量級、分布式的 Dynamo 層,用于不同的 K/V 存儲和協議。
jopen
10年前
分布式/云計算/大數據
Netflix Dynomite
1
2
3
4
5
6
7
8
9
10
經驗分享,提升職場影響力
投稿
熱門問答
熱門文檔
sesese色