登錄
注冊
首頁
項目
經驗
代碼
文庫
問答
博客
資訊
數據挖掘
(共
173
篇經驗)
0
推薦
18K
瀏覽
Mahout快速入門教程
Mahout 是一個很強大的數據挖掘工具,是一個分布式機器學習算法的集合,包括:被稱為Taste的分布式協同過濾的實現、分類、聚類等。Mahout最大的優點就 是基于hadoop實現,把很多以...
lidki
9年前
數據挖掘
Mahout
0
推薦
21K
瀏覽
數據挖掘的十種分析方法讓你任性挑選
數據挖掘(Data mining),又譯為資料探勘、數據挖掘、數據采礦。它是數據庫知識發現(英文:Knowledge-Discovery in Databases,縮寫:KDD)中的一個步驟。數...
cmb2
9年前
數據挖掘
0
推薦
28K
瀏覽
數據挖掘之九大定律
數據挖掘是利用業務知識從數據中發現和解釋知識(或稱為模式)的過程,這種知識是以自然或者人工形式創造的新知識。
jopen
9年前
數據挖掘
0
推薦
25K
瀏覽
數據可挖掘的知識類型
概念/類描述就是通過對某類對象關聯數據的匯總,分析和比較,用匯總的簡潔的精確的方式對此類對象的內涵進行描述,并概括這類對象的有關特征。概念描述分為:特征性描述和區別性描述。
jopen
9年前
數據挖掘
數據可挖掘
0
推薦
140K
瀏覽
幾個可用于數據挖掘和統計分析的java庫
WEKA:WEKA是一個可用于數據挖掘任務的機器學習算法集合。該算法可以直接應用到數據集或從自己的Java代碼調用。 WEKA包含數據預處理,分類,回歸,聚類,關聯規則,和可視化工具。它也非常適...
cwf8
9年前
數據挖掘
0
推薦
35K
瀏覽
數據挖掘,數據分析,人工智能及機器學習課程匯總
數據挖掘,數據分析,人工智能及機器學習課程匯總
jopen
9年前
數據挖掘
機器學習
0
推薦
45K
瀏覽
思科安全大數據分析框架:OpenSOC
思科在 BroCON 大會上亮相了其安全大數據分析架構 OpenSOC,引起了廣泛關注。OpenSOC 是一個針對網絡包和流的大數據分析框架,它是大數據分析與安全分析技術的結合, 能夠實時的檢測...
jopen
10年前
數據挖掘
OpenSOC
0
推薦
81K
瀏覽
入門新手如何系統地學習數據挖掘?
數據挖掘:What?Why?How? 磨刀不誤砍柴工。在學習數據挖掘之前應該明白幾點: 數據挖掘目前在中國的尚未流行開,猶如屠龍之技。 數據初期的準備通常占整個數據挖掘項目工作量的70%左右。
jopen
10年前
數據挖掘
0
推薦
22K
瀏覽
Facebook的數據倉庫是如何擴展到300PB的
Facebook在數據倉庫上遇到的存儲可擴展性的挑戰是獨一無二的。我們基于Hive的數據倉庫中存儲了超過300PB的數據,并且以每日新增 600TB的速度增長。去年這個數據倉庫所存儲的數據量增長...
jopen
10年前
數據挖掘
數據倉庫
0
推薦
80K
瀏覽
Hive在騰訊數據倉庫TDW中的應用
Hive是Apache基金會下的一個在Hadoop上構建數據倉庫的開源軟件,它支持通過類SQL的HQL語言操作結構化數據。Hive的主要功 能是將類SQL的HQL語言翻譯成MapReduce代碼...
jopen
10年前
Hive
數據挖掘
0
推薦
78K
瀏覽
5個開源的商業智能工具
很難想象如果沒有正確的信息來作為支撐,如何做出完美的商業決定。商業智能(BI)工具可以很好的幫助你從所收集和存儲的大量的商業數據中提取和認識信息。換句話說,它可以將一堆數據轉化為有意義的數據...
jopen
10年前
數據挖掘
商業智能
0
推薦
149K
瀏覽
開源ETL工具:Kettle
Kettle也叫PDI,在2006年Kettle加入了開源的BI組織Pentaho,正式命名為PDI,英文全稱為Pentaho Data Integeration。Kettle是“Kettle ...
jopen
10年前
數據挖掘
Kettle
0
推薦
24K
瀏覽
Hive:基于hadoop的數據倉庫工具
Hive是基于Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供完整的sql查詢功能,可以將sql語句轉換為 MapReduce任務進行運行。其優點是學習成本低,可...
jopen
10年前
Hive
數據挖掘
0
推薦
33K
瀏覽
Kylin:基于Hadoop的開源數據倉庫OLAP分析引擎
Kylin是一個開源、分布式的OLAP分析引擎,它由eBay公司開發,并且基于Hadoop提供了SQL接口和OLAP接口,能夠支持TB到 PB級別的數據量。OLAP即聯機分析處理,它能夠幫助分析...
jopen
10年前
數據挖掘
Kylin
0
推薦
37K
瀏覽
開源MySQL數據倉庫解決方案:Infobright
Infobright是一款基于獨特的專利知識網格技術的列式數據庫。Infobright是開源的MySQL數據倉庫解決方案,引入了列存儲方 案,高強度的數據壓縮,優化的統計計算(類似sum/avg...
jopen
10年前
數據挖掘
Infobright
0
推薦
35K
瀏覽
Go開發的基于Hadoop的ETL抽取工具:Crunch
快速開發,快速運行,基于Go工具包。實現基于 Hadoop 的 ETL 和特性抽取工具。
jopen
10年前
數據挖掘
Crunch
0
推薦
61K
瀏覽
六款強大的開源數據挖掘工具推薦
當今這個大數據時代,數據就等于金錢。隨著向一個基于應用的領域過渡,數據則呈現出了指數級增長。然而,百分之八十的數據是非結構化的,因此它需要一個程序和方法來從中提取有用信息,并且將其轉換為可理解、...
jopen
10年前
數據挖掘
0
推薦
73K
瀏覽
來自 eBay 的 OLAP 分析引擎:Kylin
Kylin 是一個來自 eBay 公司開發的開源分布式OLAP 分析引擎,基于 Hadoop 提供 SQL 接口和 OLAP 接口,支持 TB 到 PB 級別的數據量。
jopen
10年前
數據挖掘
Kylin
0
推薦
78K
瀏覽
數據挖掘-分詞入門
谷歌4億英鎊收購人工智能公司DeepMind,百度目前正推進“百度大腦”項目,騰訊、阿里等各大巨頭布局深度學習。隨著社會化數據大量產生,硬件速度上升、成本降低,大數據技術的落地實現,讓冷冰冰的數...
jopen
10年前
數據挖掘
0
推薦
111K
瀏覽
Hive權限介紹
目前hive支持簡單的權限管理,默認情況下是不開啟,這樣所有的用戶都具有相同的權限,同時也是超級管理員,也就對hive中的所有表都有查看和改動的權利,這樣是不符合一般數據倉庫的安全原則的。Hiv...
jopen
10年前
Hive
數據挖掘
1
2
3
4
5
6
7
8
9
經驗分享,提升職場影響力
投稿
熱門問答
熱門文檔
sesese色