• 0推薦
    43K 瀏覽

    HBase 全局一致性事務支持:Tephra

    Tephra 在 Apache HBase 的基礎上提供了全局一致性的事務支持。HBase 提供了強一致性的基于行和區域的 ACID 操作支持,但是犧牲了在跨區域操作的支持。這就要求應用開發者花...
    0推薦
    22K 瀏覽

    實現一個大規模的文檔存儲服務

    以前,我們解釋了為什么我們決定為Genius Scan選擇在文檔存儲服務上工作,以及我們是怎樣逼近這個工程的挑戰的。我們認為這個過程是值得分享得,我們也希望能夠從社區獲得反饋。
    0推薦
    18K 瀏覽

    想從事大數據、海量數據處理相關的工作,如何自學打基礎?

    海量數據分成兩塊,一是系統建設技術,二,海量數據應用。 先說系統建設,現在主流的技術是HADOOP,主要基于mapreduce的分布式框架。目前可以先學習這個。但是我的觀點,在分布式系統出來之...
    0推薦
    55K 瀏覽

    大數據的核心:數據挖掘

    大數據的核心:數據挖掘。從頭至尾我們都脫離不了數據挖掘。其實從大學到現在一直都接觸數據挖掘,但是我們不關心是什么是數據挖掘,我們關心的是我們如何通過數據挖掘過程中找到我們需要的東西,而我們更關心...
    0推薦
    54K 瀏覽

    項目心得:大屏數據可視化設計

    大屏數據可視化設計方法論很少,正好自己參與過部門多個大屏項目,所以總結了大屏可視化設計的方法。希望通過這篇文章能幫助大家整理思考過程,提高工作效率,同時很好的達到目標,找到興趣。
    0推薦
    66K 瀏覽

    深入淺出解析大數據平臺架構

    目錄: 什么是大數據 Hadoop介紹-HDFS、MR、Hbase 大數據平臺應用舉例-騰訊 公司的大數據平臺架構
    0推薦
    311K 瀏覽

    揭秘騰訊大數據平臺與推薦應用架構

    如今騰訊的數據分析已經能做到始終“不落地”,即全部的實時處理。騰訊大數據平臺有如下核心模塊:TDW、TRC、TDBank、TPR和 Gaia。簡單來說,TDW用來做批量的離線計算,TRC負責做流...
    0推薦
    32K 瀏覽

    Hadoop面試題,看看你能答對多少?答案在后面

    大數據技術Hadoop面試題,看看你能答對多少?答案在后面
    0推薦
    33K 瀏覽

    視頻類網站大數據生態 Spark在愛奇藝的應用實踐

    視頻類網站大數據生態 Spark在愛奇藝的應用實踐
    0推薦
    177K 瀏覽

    Spark SQL 初探: 使用大數據分析2000萬數據

    Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的并行計算框架,Spark基于map reduce算法實現的分布式計算,擁有Hadoop Map...
    0推薦
    17K 瀏覽

    類似 Git 的分布式文件系統:Pfs

    Pfs是一個類似于Git的分布式文件系統,專門構建用于Docker生態系統。你需要使用Docker來部署它,就像在您堆棧中的其他應用程序。
    0推薦
    136K 瀏覽

    Spark 配置指南

    Spark可以在三個地方配置系統: Spark屬性控制大部分的應用參數。 這些屬性可以通過SparkConf對象, 或者Java系統屬性. 環境變量可以為每臺機器配置,比如IP地址, 通...
    0推薦
    22K 瀏覽

    FreeNAS安裝與應用—安裝篇

    FreeNAS是一套免費的NAS服務器,它能將一部普通PC變成網絡存儲服務器。該軟件基于FreeBSD,Samba 及PHP,支持CIFS (samba), FTP, NFS pro...
    0推薦
    23K 瀏覽

    來自阿里的流處理框架:JStorm

    關于流處理框架,在先前的文章匯總已經介紹過Strom, 今天學習的是來自阿里的的流處理框架JStorm。簡單的概述Storm就是:JStorm 比Storm更穩定,更強大,更快,Storm上跑的...
    0推薦
    22K 瀏覽

    面向Hadoop框架的高級語言: Apache Pig

    Apache Pig是用來處理大規模數據的高級查詢語言,配合 Hadoop使用,可以在處理海量數據時達到事半功倍的效果,比使用Java,C++等語言編寫大規模數據處理程序的難度要小N倍,實現同樣...
    0推薦
    22K 瀏覽

    Oozie:Hadoop工作調度工具

    在Hadoop中執行的任務有時候需要把多個Map/Reduce作業連接到一起,這樣才能夠達到目的。在Hadoop生態圈中,有一個相對比較新的組件叫做Oozie,它讓我們可以把多個Map/Redu...
    0推薦
    21K 瀏覽

    分布式日志系統:Scribe

    Scribe是Facebook開源的日志收集系統,在Facebook內部已經得到大量的應用。它能夠從各種日志源上收集日志,存儲到一個中央存 儲系統(可以是NFS,分布式文件系統等)上,以便于進行...
    0推薦
    40K 瀏覽

    分布式服務框架:Zookeeper

    Zookeeper是一個高性能,分布式的,開源分布式應用協調服務。它提供了簡單原始的功能,分布式應用可以基于它實現更高級的服務,比如同步, 配置管理,集群管理,名空間。它被設計為易于編程,使用文...
    0推薦
    108K 瀏覽

    hadoop2.5.1安裝到虛擬機

    hadoop2.5.1安裝到虛擬機
    0推薦
    26K 瀏覽

    storm 原理簡介及單機版安裝指南

    Storm是一個分布式的、高容錯的實時計算系統。 Storm對于實時計算的的意義相當于Hadoop對于批處理的意義。Hadoop為我們提供了Map和Reduce原語,使我們對數據進行批處理變的...
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色