• 0推薦
    18K 瀏覽

    Mahout快速入門教程

    Mahout 是一個很強大的數據挖掘工具,是一個分布式機器學習算法的集合,包括:被稱為Taste的分布式協同過濾的實現、分類、聚類等。Mahout最大的優點就 是基于hadoop實現,把很多以...
    lidki 9年前   
    0推薦
    21K 瀏覽

    數據挖掘的十種分析方法讓你任性挑選

    數據挖掘(Data mining),又譯為資料探勘、數據挖掘、數據采礦。它是數據庫知識發現(英文:Knowledge-Discovery in Databases,縮寫:KDD)中的一個步驟。數...
    cmb2 9年前   
    0推薦
    28K 瀏覽

    數據挖掘之九大定律

    數據挖掘是利用業務知識從數據中發現和解釋知識(或稱為模式)的過程,這種知識是以自然或者人工形式創造的新知識。
    jopen 9年前   
    0推薦
    25K 瀏覽

    數據可挖掘的知識類型

    概念/類描述就是通過對某類對象關聯數據的匯總,分析和比較,用匯總的簡潔的精確的方式對此類對象的內涵進行描述,并概括這類對象的有關特征。概念描述分為:特征性描述和區別性描述。
    0推薦
    140K 瀏覽

    幾個可用于數據挖掘和統計分析的java庫

    WEKA:WEKA是一個可用于數據挖掘任務的機器學習算法集合。該算法可以直接應用到數據集或從自己的Java代碼調用。 WEKA包含數據預處理,分類,回歸,聚類,關聯規則,和可視化工具。它也非常適...
    cwf8 9年前   
    0推薦
    35K 瀏覽

    數據挖掘,數據分析,人工智能及機器學習課程匯總

    數據挖掘,數據分析,人工智能及機器學習課程匯總
    jopen 9年前   
    0推薦
    45K 瀏覽

    思科安全大數據分析框架:OpenSOC

    思科在 BroCON 大會上亮相了其安全大數據分析架構 OpenSOC,引起了廣泛關注。OpenSOC 是一個針對網絡包和流的大數據分析框架,它是大數據分析與安全分析技術的結合, 能夠實時的檢測...
    jopen 10年前   
    0推薦
    81K 瀏覽

    入門新手如何系統地學習數據挖掘?

    數據挖掘:What?Why?How? 磨刀不誤砍柴工。在學習數據挖掘之前應該明白幾點: 數據挖掘目前在中國的尚未流行開,猶如屠龍之技。 數據初期的準備通常占整個數據挖掘項目工作量的70%左右。
    jopen 10年前   
    0推薦
    22K 瀏覽

    Facebook的數據倉庫是如何擴展到300PB的

    Facebook在數據倉庫上遇到的存儲可擴展性的挑戰是獨一無二的。我們基于Hive的數據倉庫中存儲了超過300PB的數據,并且以每日新增 600TB的速度增長。去年這個數據倉庫所存儲的數據量增長...
    jopen 10年前   
    0推薦
    80K 瀏覽

    Hive在騰訊數據倉庫TDW中的應用

    Hive是Apache基金會下的一個在Hadoop上構建數據倉庫的開源軟件,它支持通過類SQL的HQL語言操作結構化數據。Hive的主要功 能是將類SQL的HQL語言翻譯成MapReduce代碼...
    jopen 10年前   
    0推薦
    78K 瀏覽

    5個開源的商業智能工具

      很難想象如果沒有正確的信息來作為支撐,如何做出完美的商業決定。商業智能(BI)工具可以很好的幫助你從所收集和存儲的大量的商業數據中提取和認識信息。換句話說,它可以將一堆數據轉化為有意義的數據...
    jopen 10年前   
    0推薦
    149K 瀏覽

    開源ETL工具:Kettle

    Kettle也叫PDI,在2006年Kettle加入了開源的BI組織Pentaho,正式命名為PDI,英文全稱為Pentaho Data Integeration。Kettle是“Kettle ...
    jopen 10年前   
    0推薦
    24K 瀏覽

    Hive:基于hadoop的數據倉庫工具

    Hive是基于Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供完整的sql查詢功能,可以將sql語句轉換為 MapReduce任務進行運行。其優點是學習成本低,可...
    jopen 10年前   
    0推薦
    33K 瀏覽

    Kylin:基于Hadoop的開源數據倉庫OLAP分析引擎

    Kylin是一個開源、分布式的OLAP分析引擎,它由eBay公司開發,并且基于Hadoop提供了SQL接口和OLAP接口,能夠支持TB到 PB級別的數據量。OLAP即聯機分析處理,它能夠幫助分析...
    jopen 10年前   
    0推薦
    37K 瀏覽

    開源MySQL數據倉庫解決方案:Infobright

    Infobright是一款基于獨特的專利知識網格技術的列式數據庫。Infobright是開源的MySQL數據倉庫解決方案,引入了列存儲方 案,高強度的數據壓縮,優化的統計計算(類似sum/avg...
    jopen 10年前   
    0推薦
    35K 瀏覽

    Go開發的基于Hadoop的ETL抽取工具:Crunch

    快速開發,快速運行,基于Go工具包。實現基于 Hadoop 的 ETL 和特性抽取工具。
    jopen 10年前   
    0推薦
    61K 瀏覽

    六款強大的開源數據挖掘工具推薦

    當今這個大數據時代,數據就等于金錢。隨著向一個基于應用的領域過渡,數據則呈現出了指數級增長。然而,百分之八十的數據是非結構化的,因此它需要一個程序和方法來從中提取有用信息,并且將其轉換為可理解、...
    jopen 10年前   
    0推薦
    73K 瀏覽

    來自 eBay 的 OLAP 分析引擎:Kylin

    Kylin 是一個來自 eBay 公司開發的開源分布式OLAP 分析引擎,基于 Hadoop 提供 SQL 接口和 OLAP 接口,支持 TB 到 PB 級別的數據量。
    jopen 10年前   
    0推薦
    78K 瀏覽

    數據挖掘-分詞入門

    谷歌4億英鎊收購人工智能公司DeepMind,百度目前正推進“百度大腦”項目,騰訊、阿里等各大巨頭布局深度學習。隨著社會化數據大量產生,硬件速度上升、成本降低,大數據技術的落地實現,讓冷冰冰的數...
    jopen 10年前   
    0推薦
    111K 瀏覽

    Hive權限介紹

    目前hive支持簡單的權限管理,默認情況下是不開啟,這樣所有的用戶都具有相同的權限,同時也是超級管理員,也就對hive中的所有表都有查看和改動的權利,這樣是不符合一般數據倉庫的安全原則的。Hiv...
    jopen 10年前   
    1 2 3 4 5 6 7 8 9

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色