• 0推薦
    19K 瀏覽

    Hadoop 2.x HDFS新特性

    Hadoop 2.x HDFS新特性 HDFS聯邦 HDFS HA(要用到zookeeper等,留在后面再講) HDFS快照
    0推薦
    43K 瀏覽

    云計算8項核心技術全解讀

    云計算的“橫空出世”讓很多人將其視為一項全新的技術,但事實上它的雛形已出現多年,只是最近幾年才開始取得相對較快的發展。確切地說,云計算是大規模分布式計算技術及其配套商業模式演進的產物,它的發展主...
    0推薦
    13K 瀏覽

    分布式文件系統介紹

    還是很多很多年前,做過一個小系統,是一個和支付相關的小系統。因為是一個小系統,所以一切都那么簡單。一臺應用服務器,一臺數據庫服務器;文件、圖片都放在應用服務器上,一切都是那么的平淡,一切都是那么...
    0推薦
    28K 瀏覽

    《Hadoop基礎教程》之初識Hadoop

    Hadoop一直是我想學習的技術,正巧最近項目組要做電子商城,我就開始研究Hadoop,雖然最后鑒定Hadoop不適用我們的項目,但是我會繼續研究下去,技多不壓身。
    0推薦
    30K 瀏覽

    Spark on Yarn

    最近從Hadoop 1.x 轉到Hadoop 2.x 同時將一些java 程序轉為Scala的程序將平臺上的代碼減少了很多,在實施的過程中,開到一些Spark相關的YARN的部署上都是基于之前的...
    0推薦
    19K 瀏覽

    Apache Pig的前世今生

    Pig 最早是雅虎公司的一個基于Hadoop的并行處理架構,后來Yahoo將Pig捐獻給Apache(一個開源軟件的基金組織)的一個項目,由Apache 來負責維護,Pig是一個基于 Hadoo...
    0推薦
    13K 瀏覽

    基于 HTTP 的文件系統:SpockFS

    SpockFS 是一個基于 HTTP 的文件系統,其基于純 HTTP 方法和 Header 構建,支持所有 FUSE POSIX 相關的方法,包括符號鏈接。
    0推薦
    46K 瀏覽

    云計算的核心技術

    云計算的“橫空出世”讓很多人將其視為一項全新的技術,但事實上它的雛形已出現多年,只是最近幾年才開始取得相對較快的發展。確切地說,云計算是大規模分布式計算技術及其配套商業模式演進的產物,它的發展主...
    0推薦
    31K 瀏覽

    zimg的golang版本:Gimg

    用 Go 語言開發的圖片存儲和實時處理項目 zimg 的 golang 版本, 支持 SSDB 和 Redis 作為存儲后端.
    0推薦
    56K 瀏覽

    高可用,完全分布式Hadoop集群HDFS和MapReduce安裝配置指南

    (WJW)高可用,完全分布式Hadoop集群HDFS和MapReduce安裝配置指南
    0推薦
    32K 瀏覽

    大數據是不是數據挖掘的延伸?

    數據挖掘基于數據庫理論,機器學習,人工智能,現代統計學的迅速發展的交叉學科,在很多領域中都有應用。涉及到很多的算法,源于機器 學習的神經網絡,決策樹,也有基于統計學習理論的支持向量機,分類回歸樹...
    0推薦
    76K 瀏覽

    分布式計算框架:Google Cloud Dataflow

    Google Cloud Dataflow是一種構建、管理和優化復雜數據處理流水線的方法,集成了許多內部技術,如用于數據高效并行化處理的Flume和具有良好容錯機制流處理的MillWheel。D...
    0推薦
    38K 瀏覽

    面向機器學習的分布式計算框架 Petuum 入門介紹

    Petuum是 一個機器學習專用分布式計算框架,本文介紹其架構,并基于文章 More Effective Distributed ML via a Stale Synchronous Paral...
    0推薦
    48K 瀏覽

    面向圖的分布式內存計算框架:GraphLab

    GraphLab是一個面向大規模機器學習/圖計算的分布式內存計算框架,由CMU在2009年開始的一個C++項目,這里的內容是基于論文
    0推薦
    246K 瀏覽

    基于Spark的圖計算框架 GraphX 入門介紹

    GraphX是 Spark中用于圖(e.g., Web-Graphs and Social Networks)和圖并行計算(e.g., PageRank and Collaborative Fi...
    0推薦
    65K 瀏覽

    分布式計算 Spark 入門介紹

    Spark是一個通用的分布式內存計算框架,本文主要研討Spark的核心數據結構RDD的設計思路,及其在內存上的容錯。內容基于論文
    0推薦
    44K 瀏覽

    Zookeeper內幕

    這篇博文是關于Zookeeper官網上zookeeperInternals的翻譯講述了Zookeeper的內部機制
    0推薦
    77K 瀏覽

    夜話存儲:從調侃OpenStack和Ceph談起

    F君:“我來介紹一下OpenStack,美國有句名言叫做‘兩只火雞也成不了雄鷹’,OpenStack就是這種指導思想下的產物。” “為了徹底解決這個歷史問題,OpenStack的戰略...
    0推薦
    35K 瀏覽

    云存儲架構三種經典流派全解讀

    近日,在UnitedStack組織的存儲技術研討會上,三位來自于UnitedStack、IBM和HP的存儲專家分別就UnitedStack 文件共享服務、IBM彈性存儲和HP Helion VS...
    0推薦
    22K 瀏覽

    IndexFS: Scaling File System Metadata Performance論文讀后感

    這篇論文比較新,發表于2014年11月SC(supercomputing)會議上。SC是高性能計算領域的旗艦會議,每年錄取約80篇論文,但參會人數經常超過萬人,今年在新奧爾良召開。IndexFS...
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色