• 0推薦
    31K 瀏覽

    Storm 集群安裝配置

    本文詳細介紹了 Storm 集群的安裝配置方法。如果需要在 AWS 上安裝 Storm,你應該先了解一下 storm-deploy 項目。 storm-deploy 可以自動完成 E2 上 St...
    0推薦
    46K 瀏覽

    海量數據存儲基礎

    微博平臺研發作為微博的底層數據及業務支撐部門,已經經歷了5年的發展歷程。伴隨著從數據及業務暴發式增長,我們在海量數據存儲方面遭遇了諸多挑戰,與此同時也伴隨著豐富經驗的積累。 本文主要面...
    0推薦
    9K 瀏覽

    storm集群配置

    storm集群配置
    0推薦
    23K 瀏覽

    GraphX 圖數據建模和存儲

    簡單分析一下GraphX是怎么為圖數據建模和存儲的。
    0推薦
    162K 瀏覽

    OpenShift 3 : 基于docker的私有平臺即服務

    Openshift是一個非常有前途的私用PAAS解決方案,它可以減少從項目開始時到自動構建應用和布署的時間, 它支持絕大多數的WEB架構,將成為基于容器的私有平臺即服務的一個參照。
    0推薦
    12K 瀏覽

    高性能分布式數據存儲:MORPHiS

    MORPHiS 現在是早期階段,主要目標是成為一個全局加密分布式存儲,為了替代云存儲。MORPHiS 現在包含一個 DMAIL(分布式郵件),內置垃圾郵件攔截,內置加密,免費發送信息。
    0推薦
    32K 瀏覽

    大數據與Hadoop之間是什么關系?

    大數據在近些年來越來越火熱,人們在提到大數據遇到了很多相關概念上的問題,比如云計算、 Hadoop等等。那么,大數據是什么、Hadoop是什么,大數據和Hadoop有什么關系呢?
    0推薦
    23K 瀏覽

    在 CentOS 7.1 上安裝分布式存儲系統 Ceph

    關于 Ceph 的介紹網上一大堆,這里就不重復了。Sage Weil 讀博士的時候開發了這套牛逼的分布式存儲系統,最初是奔著高性能分布式文件系統去的,結果云計算風口一來,Ceph 重心轉向了分布...
    0推薦
    19K 瀏覽

    通過Mesos、Docker和Go,使用300行代碼創建一個分布式系統

    構建一個分布式系統是很困難的。它需要可擴展性、容錯性、高可用性、一致性、可伸縮以及高效。為了達到這些目的,分布式系統需要很多復雜的組件以一種復雜的方式協同工作。例如,Apache Hadoop在...
    0推薦
    17K 瀏覽

    Apache Storm 命令行操作

    本文介紹了 Storm 命令行客戶端中的所有命令操作。如果想要了解怎樣設置你的 Strom 客戶端和遠程集群的交互,請按照配置開發環境一文中的步驟操作。
    0推薦
    13K 瀏覽

    Go 開發的高一致性分布存儲:hyflow-go

    hyflow-go是一款可進行地理復制、主內存main-memory的高一致性數據存儲,其最大特點是將低延時和高事務完美統一。
    0推薦
    20K 瀏覽

    詳解Hadoop核心架構

    通過對Hadoop分布式計算平臺最核心的分布式文件系統HDFS、MapReduce處理過程,以及數據倉庫工具Hive和分布式數據庫Hbase的介紹,基本涵蓋了Hadoop分布式平臺的所有技術核心。
    0推薦
    16K 瀏覽

    如何配置一個 Docker Swarm 原生集群

    嗨,大家好。今天我們來學一學Swarm相關的內容吧,我們將學習通過Swarm來創建Docker原生集群。Docker Swarm是用于Docker的原生集群項目,它可以將一個Docker主機池轉...
    0推薦
    15K 瀏覽

    基于Hadoop的大規模網絡流量分析

    在網絡流量的分析中,基于流的分析被大多數ISP所采用,分析系統一般部 署在一臺高配置的服務器中。如由CERT網絡勢態感知團隊(CERT-NetSA)開發的用于大規模網絡安全分析的網絡交互分析工具...
    0推薦
    41K 瀏覽

    Spark處理Json格式數據(Python)

    Spark能夠自動推斷出Json數據集的“數據模式”(Schema),并將它加載為一個SchemaRDD實例。這種“自動”的行為是通過下述兩種方法實現的:
    0推薦
    73K 瀏覽

    如何使用Spark ALS實現協同過濾

    本文主要記錄最近一段時間學習和實現Spark MLlib中的協同過濾的一些總結,希望對大家熟悉Spark ALS算法有所幫助。 更新:
    0推薦
    48K 瀏覽

    騰訊藍鯨數據平臺之告警系統

    以下是我參與藍鯨數據平臺的建設過程中的一些心得體會,關于整個藍鯨平臺的更多內容,請見
    0推薦
    20K 瀏覽

    騰訊TDW:大型Hadoop集群應用

    TDW(Tencent distributed Data Warehouse,騰訊分布式數據倉庫)基于開源軟件Hadoop和Hive進行構建,打破了傳統數據倉庫不能線性擴展、可控性差的局限,并且...
    0推薦
    20K 瀏覽

    提供程序使用 Apache Spark 的基礎:Spark Kernel

    Spark Kernel 的最主要目標:提供基礎給交互應用程序聯系和使用 Apache Spark。
    0推薦
    54K 瀏覽

    大數據架構:flume-ng+Kafka+Storm+HDFS 實時系統組合

    做軟件開發的都知道模塊化思想,這樣設計的原因有兩方面: 一方面是可以模塊化,功能劃分更加清晰,從“數據采集--數據接入--流失計算--數據輸出/存儲”
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色