推薦五個免費開源數據挖掘軟件(Orange、RapidMiner等)

jopen 12年前發布 | 97K 次閱讀 數據挖掘

  Orange

  Orange 是一個基于組件的數據挖掘和機器學習軟件套裝,它的功能即友好,又很強大,快速而又多功能的可視化編程前端,以便瀏覽數據分析和可視化,基綁定了 Python以進行腳本開發。它包含了完整的一系列的組件以進行數據預處理,并提供了數據帳目,過渡,建模,模式評估和勘探的功能。其由C++和 Python開發,它的圖形庫是由跨平臺的Qt框架開發。

  RapidMiner

  RapidMiner, 以前叫 YALE (Yet Another Learning Environment),其是一個給機器學習和數據挖掘和分析的試驗環境,同時用于研究了真實世界數據挖掘。它提供的實驗由大量的算子組成,而這些算子由詳細的XML 文件記錄,并被RapidMiner圖形化的用戶接口表現出來。RapidMiner為主要的機器學習過程提供了超過500算子,并且,其結合了學習方案和Weka學習環境的屬性評估器。它是一個獨立的工具可以用來做數據分析,同樣也是一個數據挖掘引擎可以用來集成到你的產品中。

  Weka

  由Java開發的 Weka (Waikato Environment for Knowledge Analysis)是一個知名機器學機軟件,其支持幾種經典的數據挖掘任務,顯著的數據預處理,集群,分類,回歸,虛擬化,以及功能選擇。其技術基于假設數據是以一種單個文件或關聯的,在那里,每個數據點都被許多屬性標注。 Weka 使用Java的數據庫鏈接能力可以訪問SQL數據庫,并可以處理一個數據庫的查詢結果。它主要的用戶接品是Explorer,也同樣支持相同功能的命令行,或是一種基于組件的知識流接口。

  JHepWork

  為科學家,工程師和學生所設計的 jHepWork 是一個免費的開源數據分析框架,其主要是用開源庫來創建一個數據分析環境,并提供了豐富的用戶接口,以此來和那些收費的的軟件競爭。它主要是為了科學計算用的二維和三維的制圖,并包含了用Java實現的數學科學庫,隨機數,和其它的數據挖掘算法。 jHepWork 是基于一個高級的編程語言 Jython,當然,Java代碼同樣可以用來調用 jHepWork 的數學和圖形庫。

  KNIME

  KNIME (Konstanz Information Miner)是一個用戶友好,智能的,并有豐演的開源的數據集成,數據處理,數據分析和數據勘探平臺。它給了用戶有能力以可視化的方式創建數據流或數據通道,可選擇性地運行一些或全部的分析步驟,并以后面研究結果,模型以及可交互的視圖。 KNIME 由Java寫成,其基于 Eclipse 并通過插件的方式來提供更多的功能。通過以插件的文件,用戶可以為文件,圖片,和時間序列加入處理模塊,并可以集成到其它各種各樣的開源項目中,比如:R 語言,Weka, Chemistry Development Kit,和 LibSVM.

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!