• 0推薦
    9K 瀏覽

    基于社交網絡挖掘公司潛在用戶

    作為銷售人員,在向客戶介紹公司的新產品或技術的時候,是否考慮過參考已有的客戶成功案例去說服新客戶?是否想要去發現某客戶可能采用的公司產品?是否希望去挖掘公司潛在的客戶?回答是肯定的。挖掘潛在客戶...
    0推薦
    17K 瀏覽

    ELK 在 Spark 集群的應用

    大數據處理技術越來越火,云計算平臺也如火如荼,二者猶如 IT 列車的兩個車輪,相輔相成,高速發展。如果我們將大數據處理平臺比作一個可能會得病的人的話,那么日志分析系統就是給病人診斷的醫生。由于集...
    0推薦
    9K 瀏覽

    如何打造百億級數據處理量的彈性調度容器平臺

    這些文件持續在線且數據種類多樣,如果用戶把這些文件在自己的基板上處理好后再上傳到七牛,是非常不合算的事情。而七牛最先提供基于存儲的數據處理功能方便用戶去做數據處理,這些數據處理通常放在企業的客戶...
    0推薦
    17K 瀏覽

    面向大數據的時空數據挖掘

    時空數據挖掘是數據挖掘中的重要研究內容,其中時空預測的應用領域最為廣泛。隨著信息技術的發展,人們已經不滿足于單純的空間數據的存儲和展現,而是需要更先進的手段幫助理解空間數據的變化,發現空間數據之...
    0推薦
    14K 瀏覽

    Presto架構及原理

    Presto 是 Facebook 推出的一個基于Java開發的大數據分布式 SQL 查詢引擎,可對從數 G 到數 P 的大數據進行交互式的查詢,查詢的速度達到商業數據倉庫的級別,據稱該引擎的性...
    0推薦
    18K 瀏覽

    RabbitMQ 高級指南:實現分布式通信

    分布式系統是指: 通過網絡把多個組件連接起來,并提供組件之間消息傳遞和協作的系統。 分布式系統要解決的問題很多,異構、伸縮性、開放、安全、容錯等,但是基本問題是—— 提供組件之間消息通信 。沒有...
    0推薦
    13K 瀏覽

    漫畫:什么是大數據?

    大數據是具有海量、高增長率和多樣化的信息資產,它需要全新的處理模式來增強決策力、洞察發現力和流程優化能力。
    0推薦
    9K 瀏覽

    大數據基礎框架設計——實時分析技術平臺洞察與實踐

    今年是IoT物聯網的元年,也是人工智能的元年。之所以人工智能這么熱,與大數據有密不可分的關系,大數據就是現在網絡時代的石油。
    0推薦
    28K 瀏覽

    分布式系統,你真的了解嗎?

    當一個互聯網業務獲得大眾歡迎的時候,最顯著碰到的技術問題,就是服務器非常繁忙。當每天有1000萬個用戶訪問你的網站時,無論你使用什么樣的服務器硬件,都不可能只用一臺機器就承載的了。因此,在互聯網...
    0推薦
    13K 瀏覽

    分布式緩存技術PK:選擇Redis還是Memcached?

    總的來看,Redis比Memcached的功能多很多,實現也更復雜。 不過Memcached更專注于保存key-value數據(這已經能滿足大多數使用場景了),而Redis提供更豐富的數據結構及其他的一些功能。
    0推薦
    13K 瀏覽

    Storm 的可靠性保證測試

    Storm 是一個分布式的實時計算框架,可以很方便地對流式數據進行實時處理和分析,能運用在實時分析、在線數據挖掘、持續計算以及分布式 RPC 等場景下。Storm 的實時性可以使得數據從收集到處...
    0推薦
    7K 瀏覽

    Spark生態系統中的圖數據分析知識

    圖結構可有效表示稀疏矩陣,因而圖數據分析可用于實現大數據分析。本文是Info對該書作者的訪談,內容包括圖數據及分析技術、GraphX高效程序開發、圖數據分析的趨勢等。
    0推薦
    9K 瀏覽

    當簡單的計算遇上了大數,其實大數運算也很簡單

    大數的相加主要是通過字符串的相加來實現的。兩個大數相加,找出位數較大的那個大數獲取對應的長度, 然后對較小的那個數進行左補0直至長度和較大的那個數的位數一樣,最后循環累加兩個大數的每一位的數值...
    0推薦
    9K 瀏覽

    你還需要知道的9個大數據技術

    Hadoop是大數據領域最流行的技術,但并非唯一。還有很多其他技術可用于解決大數據問題。除了Apache Hadoop外,另外9個大數據技術也是必須要了解的。
    0推薦
    9K 瀏覽

    經驗分享 :大數據如何給運營做支撐

    隨著互聯網、媒體、用戶、市場的變化,企業發現過去他們所做的粗狂式運營已經不能有效的提升效率和增加企業用戶了,所以,一些企業開始找尋新的運營方式,比如逐漸轉變為CPM(每千人成本)化的精細化經營,...
    0推薦
    45K 瀏覽

    生成全局唯一 ID 的 3 個思路

    標識(ID / Identifier)是無處不在的,生成標識的主體是人,那么它就是一個命名過程,如果是計算機,那么它就是一個生成過程。如何保證分布式系統下,并行生成標識的唯一與標識的命名空間有著密不可分的關系。
    0推薦
    13K 瀏覽

    Hive SQL 監控系統 - Hive Falcon

    在開發工作當中,提交 Hadoop 任務,任務的運行詳情,這是我們所關心的,當業務并不復雜的時候,我們可以使用 Hadoop 提供的命令工具去管理 YARN 中的任務。在編寫 Hive SQL ...
    0推薦
    46K 瀏覽

    每天近百億條用戶數據,攜程大數據高并發應用架構涅槃

    互聯網二次革命的移動互聯網時代,如何吸引用戶、留住用戶并深入挖掘用戶價值,在激烈的競爭中脫穎而出,是各大電商的重要課題。通過各類大數據對用戶進行研究,以數據驅動產品是解決這個課題的主要手段,攜程...
    0推薦
    9K 瀏覽

    PPTV之大數據集群容器化研究

    PPTV作為國內視頻領域的領先者,對于大規模流媒體的存儲、處理、分發及應用,有著迫切的要求。容器技術及微服務模式的出現,使大規模的研發交付效率大為提高。因此我們基于Docker技術打造了DCOS。
    0推薦
    20K 瀏覽

    分布式系統互斥性與冪等性問題的分析與解決

    隨著互聯網信息技術的飛速發展,數據量不斷增大,業務邏輯也日趨復雜,對系統的高并發訪問、海量數據處理的場景也越來越多。如何用較低成本實現系統的高可用、易伸縮、可擴展等目標就顯得越發重要。為了解決這...
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色