• P52

    weka完整中文教程 文檔

    WEKA的全名是懷卡托智能分析環境(Waikato Environment for Knowledge Analysis),同時weka也是新西蘭的一種鳥名,而WEKA的主要開發者來自新西蘭。 WEKA作為一個公開的數據挖掘工作平臺,集合了大量能承擔數據挖掘任務的機器學習算法,包括對數據進行預處理,分類,回歸、聚類、關聯規則以及在新的交互式界面上的可視化。 如果想自己實現數據挖掘算法的話,可以參考weka的接口文檔。在weka中集成自己的算法甚至借鑒它的方法自己實現可視化工具并不是件很困難的事情。

    mn3n 2015-12-13   2046   0
    P29

      數據挖掘算法以及其實現 文檔

    基于線性回歸模型擬合一個班學生的學習成績,建立預測模型。數據可由自己建立100個學生的學習成績。

    maoying 2017-04-26   847   0
    P9

      數據挖掘最常見的十種方法 文檔

    下面介紹十種數據挖掘(Data Mining)的分析方法,以便于大家對模型的初步了解,這些都是日常挖掘中經常遇到的算法,希望對大家有用!(甚至有數據挖掘公司,用其中的一種算法就能獨步天下)

    maoying 2017-04-26   1114   0
    P20

      kettle 基礎整理 文檔

    Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,數據抽取高效穩定。

    junb_chen 2017-04-23   1508   0
    數據挖掘   培訓   HTTP   SQL   XML  
    P31

      pentaho61教學文件 文檔

    chiangandy 2017-04-01   981   0
    數據挖掘   教學   手冊   HTTP   Go  
    P6

      etl構建數據倉庫五步法 文檔

    在數據倉庫構建中,ETL貫穿于項目始終,它是整個數據倉庫的生命線,包括了從數據清洗,整合,到轉換,加載等的各個過程,如果說數據倉庫是一座大廈,那么ETL就是大廈的根基,ETL抽取整合數據的好壞直接影響到最終的結果展現。所以ETL在整個數據倉庫項目中起著十分關鍵的作用,必須擺到十分重要的位置。

    opengzmaq 2017-03-03   946   0
    P16

      hive1.2.1安裝部署說明書 文檔

    shenxxPH 2016-12-26   680   0
    數據挖掘   x86   SQL  
    P9

      kettle規范文檔 文檔

    ETL的開發目前使用IBM的Datastage Designer工具,在開發人員的客戶機上這客戶端工具進行開發,不允許使用遠程登錄到服務器的方法進行開發,ETL的開發原則涉及很多方面,本文檔根據DataStage的對象的分類,從大到小分Project、Job、Stage等幾塊來描述:

    snowyon 2016-11-21   1073   0
    P3

      elt 之 kettle 開發規范 文檔

    本ETL流程規范試圖建立一個通用的ETL流程開發規范,針對不同項目組的實際情況,可自行進行逐步的完善和修改。

    snowyon 2016-11-21   1059   0
    P2

      數組 文檔

    【數組】數組是同一數據類型的一組值數組屬于引用類型,因此存儲在堆內存中數組元素初始化或給數組元素賦值都可以在聲明數組時或在程序的后面階段中進行定義-數組定義時[]必須接在類型后面,不能接在數組名后面。

    1994_ 2016-10-07   2938   0
    P43

      teradata數據倉庫簡介 文檔

    Teradata數據庫簡介Teradata數據倉庫事業部華南區Agenda關于TERADATATeradata數據庫原理Teradata數據庫架構Teradata數據庫工作原理Teradata特性Teradata數據倉庫構建基本概念常用工具介紹管理的一些約定關于TERADATATeradata最初產生于1976年,由加州理工學院和花旗銀行的高科技項目-創建一個能夠分析10的12次方bytes數據的系統。

    zimeng2008 2016-05-27   1157   0
    P81

      數據挖掘講座 文檔

    數據倉庫概念 數據倉庫體系結構及組件 數據倉庫設計 數據倉庫技術(與數據庫技術的區別) 數據倉庫性能 數據倉庫應用 數據挖掘應用概述 數據挖掘技術與趨勢 數據挖掘應用平臺(科委申請項目)

    landman 2016-04-08   3242   0
    P27

      Topic-Sentiment Mixture:Modeling Facets and Opinions in Weblogs 文檔

    Customers: need peer opinions to make purchase decisions Business providers: need customers’ opinions to improve product need to track opinions to make marketing decisions Social researchers: want to know people’s reactions about social events Government: wants to know people’s reactions to a new policy Psychology, education, etc.

    cwdk 2016-02-20   1746   0
    數據挖掘   Go   diff  
    P40

      數據分析經驗分享 文檔

    Content數據分析前,我們需要思考>《孫子兵法·謀攻篇》:故上兵伐謀,其次伐交,其次伐兵,其下攻城;攻城之法為不得已。像一場戰役的總指揮影響著整個戰役的勝敗一樣,數據分析師的思想對于整體分析思路,甚至分析結果都有著關鍵性的作用。>問題分析結果呈現分析思路與方法數據選取數據分析前,我們怎么去思考?每一個步驟可能面臨的問題以及需要準備的東西????分析問題和解決問題的思路>兩個重點步驟精確的陳述問題Where----哪里存在問題?What------存在的問題是什么?Why-------原因在哪里?When-----什么時候開始出現這樣的問題?Who------與什么對象有關?Howmany-----發生的次數和數量?Howmuch------損失有多大?

    kfeole 2016-01-15   664   0
    P7

      數據挖掘中聚類分析的技術方法 文檔

    摘要:數據挖掘是信息產業界近年來非常熱門的研究方向,聚類分析是數據挖掘中的核心技術。本文對數據挖掘領域的聚類分析方法及代表算法進行分析,并從多個方面對這些算法性能進行比較,同時還對聚類分析在數據挖掘中的幾個應用進行了闡述。關鍵詞:數據挖掘;聚類分析;聚類算法

    likfefe 2016-01-14   2335   0
    P40

      數據分析經驗分享 文檔

    數據分析經驗分享Content數據分析前,我們需要思考>《孫子兵法·謀攻篇》:故上兵伐謀,其次伐交,其次伐兵,其下攻城;攻城之法為不得已。像一場戰役的總指揮影響著整個戰役的勝敗一樣,數據分析師的思想對于整體分析思路,甚至分析結果都有著關鍵性的作用。>問題分析結果呈現分析思路與方法數據選取數據分析前,我們怎么去思考?每一個步驟可能面臨的問題以及需要準備的東西????分析問題和解決問題的思路>兩個重點步驟精確的陳述問題Where----哪里存在問題?What------存在的問題是什么?Why-------原因在哪里?When-----什么時候開始出現這樣的問題?Who------與什么對象有關?Howmany-----發生的次數和數量?

    bwnx 2015-12-14   1966   0
    P118

      數據挖掘8章聚類 文檔

    第八章聚類分析8.1什么是聚類分析?8.2聚類分析中的數據類型8.3主要聚類分析方法分類8.4劃分方法(PartitioningMethods)8.5分層方法8.6基于密度的方法8.7基于網格的方法8.8基于模型(Model-Based)的聚類方法8.9孤立點分析

    kcde 2015-12-12   1799   0
    P13

      數據挖掘9章10章 文檔

    第九章數據挖掘的應用和發展趨勢9.1復雜數據對象的多維分析和描述性挖掘9.2空間數據挖掘9.3多媒體數據挖掘9.4時序數據和序列數據的挖掘9.5文本數據庫挖掘9.6Web挖掘Data Mining:Conceptsand Techniques9.1復雜數據對象的多維分析和描述性挖掘結構化數據的概化空間和多媒體數據概化中的聚集和近似計算對象標識符和類/子類層次的概化類復合層次的概化對象立方體的構造與挖掘用分而治之方法對規劃數據庫進行基于概化的挖掘

    kcde 2015-12-12   2407   0
    P26

      數據挖掘8章聚類2 文檔

    Chapter8.聚類分析什么是聚類分析?聚類分析中的數據類型主要聚類分析方法分類劃分方法(PartitioningMethods)分層方法基于密度的方法基于表格的方法基于模型(Model-Based)的聚類方法異常分析總結劃分方法:基本概念劃分方法:將一個包含n個數據對象的數據庫組織成k個劃分(k<=n),其中每個劃分代表一個簇(Cluster)。給定一個k,要構造出k個簇,并滿足采用的劃分準則:全局最優:盡可能的列舉所有的劃分;啟發式方法:k-平均和k-中心點算法k-平均(MacQueen’67):由簇的中心來代表簇;

    kcde 2015-12-12   1893   0
    1 2 3 4 5 6 7 8 9 10

    關鍵詞

    最新上傳

    熱門文檔

  • sesese色