登錄
注冊
首頁
項目
經驗
代碼
文庫
問答
博客
資訊
分布式/云計算/大數據
(共
1277
篇經驗)
0
推薦
21K
瀏覽
Storm運維調優筆記(7)——Pyleus設置拓撲worker數量
今天簡單介紹一下Pyleus設置worker數量,同時介紹設置之后worker與實際編程spout、bolt的關系。
jopen
9年前
運維技術
分布式/云計算/大數據
0
推薦
21K
瀏覽
不同的瑞士軍刀:對比 Spark 和 MapReduce
Apache 基金會下的 Spark 再次引爆了大數據的話題。帶著比 Hadoop MapReduce 速度要快 100 倍的承諾以及更加靈活方便的 API,一些人認為這或許預示著 Hadoop...
jopen
9年前
MapReduce
Spark
分布式/云計算/大數據
0
推薦
17K
瀏覽
docker容器根目錄為只讀的解決辦法
今天在啟動docker容器的時候發現一段時間后宿主機上所有的容器的根目錄全部變成了只讀,并且宿主機message日志報磁盤相關的錯
jopen
9年前
Docker
分布式/云計算/大數據
cgroups
0
推薦
23K
瀏覽
Apache Ignite(二):核心特性一覽(V1.4.0版本)
本篇主要介紹Apache Ignite的核心功能特性,有價值的功能點非常多,所以每個點寫的并不詳細,這篇文章主要目的還是方便更多的人更全面的了解它,后續的話,可能會針對某個功能點做詳細的說明。
jopen
9年前
分布式/云計算/大數據
0
推薦
20K
瀏覽
Apache Ignite(一):簡介以及和Coherence、Gemfire、Redis等的比較
Apache Ignite(一):簡介以及和Coherence、Gemfire、Redis等的比較:一、Ignite簡介 Apache Ignite 內存數組組織框架是一個高性能、集成和分布式的...
jopen
9年前
分布式/云計算/大數據
0
推薦
16K
瀏覽
大數據技術hadoop入門理論系列之二—HDFS架構簡介
HDFS全稱是Hadoop Distribute File System,是一個能運行在普通商用硬件上的分布式文件系統。與其他分布式文件系統顯著不同的特點是:
jopen
9年前
Hadoop
大數據
HDFS
分布式/云計算/大數據
0
推薦
23K
瀏覽
Spark Shuffle之Sort Shuffle
正如你所知,spark實現了多種shuffle方法,通過 spark.shuffle.manager來確定。暫時總共有三種:hash shuffle、sort shuffle和tungsten-...
jopen
9年前
Spark
分布式/云計算/大數據
0
推薦
12K
瀏覽
thrift rpc分布式組件 - tns
tns為thrift rpc分布式組件,實現rpc的高可靠、負載均衡、水平動態可擴展等,工具提供完整的命令行管理方式。
jopen
9年前
分布式/云計算/大數據
0
推薦
15K
瀏覽
大型網站技術-2. OpenStack簡述
上一章講,虛擬化能夠充分的利用資源,帶來各種各樣的好處。 當一個網站不大,只需要四五臺機器就可以支撐的時候,可以采用手工的方式虛擬機,但是當網站流量很高,需要成千上萬臺機器的時候,那就非常不方便...
jopen
9年前
云計算
OpenStack
虛擬化
分布式/云計算/大數據
0
推薦
12K
瀏覽
Spark Shuffle之Hash Shuffle
正如你所知,spark實現了多種shuffle方法,通過 spark.shuffle.manager來確定。暫時總共有三種:hash shuffle、sort shuffle和tungsten-...
jopen
9年前
Spark
哈希表
分布式/云計算/大數據
0
推薦
11K
瀏覽
hadoop的運行原理
hadoop的運行原理:hadoop主要由三方面組成: 1、HDFS 2、MapReduce 3、Hbase Hadoop框架中最核心的設計就是:MapReduce和H...
jopen
9年前
分布式/云計算/大數據
0
推薦
8K
瀏覽
Spark核心——RDD
Spark中最核心的概念為 RDD(Resilient Distributed DataSets) 中文為: 彈性分布式數據集 ,RDD為對分布式內存對象的 抽象它表示一個 被分區不可變 且能 ...
jopen
9年前
Spark
分布式/云計算/大數據
0
推薦
8K
瀏覽
πfs - 文件存儲解決方案
πfs 是一個數據庫無關的文件系統。πfs 絕對是個創新性文件系統,不會花費硬盤空間來存儲你的數據,而是把數據存儲到 π 里面。你將不會再把硬盤空間耗盡 —— π 存儲的每個文件都在,因為?π ...
jopen
9年前
存儲系統
分布式/云計算/大數據
0
推薦
23K
瀏覽
在YARN上運行Spark
在Spark0.6.0 版本開始支持 YARN 模式,隨后的版本在逐漸地完善。
jopen
9年前
Spark
YARN
分布式/云計算/大數據
0
推薦
14K
瀏覽
FastDFS 分布式的文件存儲環境搭建
FastDFS 分布式的文件存儲環境搭建
jopen
9年前
分布式/云計算/大數據
0
推薦
22K
瀏覽
在Ubuntu環境部署Apache Spark集群
在Ubuntu環境部署Apache Spark集群
jopen
9年前
分布式/云計算/大數據
0
推薦
120K
瀏覽
使用Spark DataFrame進行大數據處理
使用Spark DataFrame進行大數據處理:簡介 DataFrame讓Spark具備了處理大規模結構化數據的能力,在比原有的RDD轉化方式易用的前提下,...
jopen
9年前
分布式/云計算/大數據
0
推薦
10K
瀏覽
Hadoop和Spark的處理模型比較
Apache Spark的高性能一定程度上取決于它采用的異步并發模型(這里指server/driver端采用的模型),這與Hadoop 2.0(包括YARN和MapReduce)是一致的。Had...
jopen
9年前
Hadoop
Spark
分布式/云計算/大數據
0
推薦
8K
瀏覽
Dpark源碼剖析
Spark是一個當下很火的集群計算平臺,來自于加州大學伯克利分校的AMPLab,目前從Apache孵化器畢業,成為了Apache基金會下的頂級項目。現在的spark類似于hadoop,逐漸成長為...
jopen
9年前
Hadoop
分布式/云計算/大數據
分布式文件系統
0
推薦
8K
瀏覽
Dpark源碼剖析一(概述)
Dpark/Spark中最重要的核心就是RDD(彈性分布式數據集,Resilient Distributed Datasets),為了給今后的分析打下基礎,這篇文章首先會解釋RDD相關的重要概念...
jopen
9年前
分布式/云計算/大數據
分布式文件系統
1
2
3
4
5
6
7
8
9
10
經驗分享,提升職場影響力
投稿
熱門問答
熱門文檔
sesese色