• 0推薦
    20K 瀏覽

    Hazelcast與MongoDB集成

    Hazelcast的分布式數據結構和計算性能使得它可以作為應用程序后端的“MongoDB”。 MongoDB是一個開源的、面向文檔的數據庫,其擴展性和靈活性都非常好。MongoDB不是把...
    0推薦
    11K 瀏覽

    跟我學分布式事務之2PC和3PC

    在分布式系統中,為了保證數據的高可用,通常,我們會將數據保留多個副本(replica),這些副本會放置在不同的物理的機器上。為了對用戶提供正確的增\刪\改\差等語義,我們需要保證這些放置在不同物...
    0推薦
    17K 瀏覽

    Spark Streaming 源碼解析系列

    作為跑在商業硬件上的大數據處理框架,Apache Hadoop 在誕生后的幾年內(2005~今)火的一塌糊涂,幾乎成為了業界處理大數據的事實上的標準工具
    0推薦
    20K 瀏覽

    Hadoop簡單應用案例,包括MapReduce、單詞統計、HDFS基本操作等

    Hadoop簡單應用案例,包括MapReduce、單詞統計、HDFS基本操作、web日志分析、Zookeeper基本使用等
    0推薦
    13K 瀏覽

    設計全球級的分布式、任務關鍵型應用 - 從實際項目中得來的教訓(下)

    此篇為設計下一代智能DNS和流量管理平臺的NSONE公司的創建者和CEO Kris Beevers的客座文章的第二部分。點此閱讀第一部分
    0推薦
    23K 瀏覽

    Hbase/Hdfs刪除節點

    線上有臺服務器隨時可能會掛掉,所以需要把在這個服務器上hbase的regionserver和hdfs的datanode節點移除。然后重新拿臺新服務器部署接管。
    0推薦
    18K 瀏覽

    分布式設計與開發------幾種必須了解的分布式算法

    分布式設計與開發中有些疑難問題必須借助一些算法才能解決,比如分布式環境一致性問題,感覺以下分布式算法是必須了解的(隨著學習深入有待添加):
    0推薦
    25K 瀏覽

    基于HBase做Storm 實時計算指標存儲

    Hi,大家好!我是祝威廉,本來微博也想叫祝威廉的,可惜被人占了,于是改名叫·祝威廉二 世。然后總感覺哪里不對。目前在樂視云數據部門里從事實時計算,數據平臺、搜索和推薦等多個方向。曾從事基礎框架,...
    0推薦
    15K 瀏覽

    設計全球級的分布式、任務關鍵型應用 - 從實際項目中得來的教訓(上)

    此篇為設計下一代智能DNS和流量管理平臺的 NSONE 公司的創建者和CEO Kris Beevers 的客座文章的 第一部分 。點此閱讀 第二部分
    0推薦
    15K 瀏覽

    圖片集群分布式存儲和負載均衡

    對于Web服務器而言,用戶對圖片信息的訪問是很消耗服務器資源的。當一個網頁被瀏覽時,Web服務器與瀏覽器建立連接,每個連接表示一個并發。 當頁面包含多個圖片時,Web服務器與瀏覽器會產生多個連接...
    0推薦
    64K 瀏覽

    Spark SQL編程指南(Python)

    Spark SQL允許我們在Spark環境中使用SQL或者Hive SQL執行關系型查詢。它的核心是一個特殊類型的Spark RDD:SchemaRDD。
    0推薦
    25K 瀏覽

    淺談開源大數據平臺的演變

    一說到開源大數據處理平臺,就不得不說此領域的 開 山鼻祖Hadoop,它是GFS和MapReduce的開源實現。 雖然在此之前有很多類似的分布式存儲和計算平臺,但真正能實現工業級應用、降低使用門...
    0推薦
    20K 瀏覽

    Druid 實時數據分析存儲系統

    Druid 是一個開源的,分布式的,列存儲的,適用于實時數據分析的存儲系統,能夠快速聚合、靈活過濾、毫秒級查詢、和低延遲數據導入。
    0推薦
    61K 瀏覽

    大數據處理框架Apache Spark入門

    Apache Spark是一個圍繞速度、易用性和復雜分析構建的大數據處理框架。最初在2009年由加州大學伯克利分校的AMPLab開發,并于2010年成為Apache的開源項目之一。
    0推薦
    26K 瀏覽

    我所理解的大數據個性化推薦

    想起要寫這篇文章,一方面是昨天終于把項亮寫的《推薦系統實踐》給看完了,另一方面是自己負責的推薦系統項目已經處于一個多版本迭代的階段了,并且從最近的AB測試效果來看,新提交的算法模型還是有一定的進...
    0推薦
    180K 瀏覽

    60款頂級大數據開源工具

    說到處理大數據的工具,普通的開源解決方案(尤其是Apache Hadoop)堪稱中流砥柱。弗雷斯特調研公司的分析師Mike Gualtieri最近預測,在接下來幾年,“100%的大公司”會采用H...
    0推薦
    13K 瀏覽

    分布式的系統用于構建,部署和運行服務:PaaSTA

    PaaSTA是一個高度可用的,分布式的系統用于構建,部署和運行服務使用容器和Apache Mesos。
    0推薦
    7K 瀏覽

    Spark如何解決常見的Top N問題

    假設我們有一張各個產品線URL的訪問記錄表,該表僅僅有兩個字段:product、url,我們需要統計各個產品線下訪問次數前10的URL是哪些?
    0推薦
    12K 瀏覽

    構建高可擴Web架構和分布式系統實戰

    構建并運營一個可伸縮的Web站點或應用程序到底是指什么?在最初,僅是通過互聯網連接用戶和訪問遠程資源。 和大多數事情一樣,當構建一個Web服務時,需要提前抽出時間進行規劃。了解大型網站創...
    0推薦
    18K 瀏覽

    zookeeper分布式鎖

    zookeeper分布式鎖
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色