Mahout算法集
在Mahout實現的機器學習算法見下表
算法類 |
算法名 |
中文名 |
分類算法 |
Logistic Regression |
邏輯回歸 |
Bayesian |
貝葉斯 |
|
SVM |
支持向量機 |
|
Perceptron |
感知器算法 |
|
Neural Network |
神經網絡 |
|
Random Forests |
隨機森林 |
|
Restricted Boltzmann Machines |
有限波爾茲曼機 |
|
聚類算法 |
Canopy Clustering |
Canopy聚類 |
K-means Clustering |
K均值算法 |
|
Fuzzy K-means |
模糊K均值 |
|
Expectation Maximization |
EM聚類(期望最大化聚類) |
|
Mean Shift Clustering |
均值漂移聚類 |
|
Hierarchical Clustering |
層次聚類 |
|
Dirichlet Process Clustering |
狄里克雷過程聚類 |
|
Latent Dirichlet Allocation |
LDA聚類 |
|
Spectral Clustering |
譜聚類 |
|
關聯規則挖掘 |
Parallel FP Growth Algorithm |
并行FP Growth算法 |
回歸 |
Locally Weighted Linear Regression |
局部加權線性回歸 |
降維/維約簡 |
Singular Value Decomposition |
奇異值分解 |
Principal Components Analysis |
主成分分析 |
|
Independent Component Analysis |
獨立成分分析 |
|
Gaussian Discriminative Analysis |
高斯判別分析 |
|
進化算法 |
并行化了Watchmaker框架 |
|
推薦/協同過濾 |
Non-distributed recommenders |
Taste(UserCF, ItemCF, SlopeOne) |
Distributed Recommenders |
ItemCF |
|
向量相似度計算 |
RowSimilarityJob |
計算列間相似度 |
VectorDistanceJob |
計算向量間距離 |
|
非Map-Reduce算法 |
Hidden Markov Models |
隱馬爾科夫模型 |
集合方法擴展 |
Collections |
擴展了java的Collections類 |
Mahout最大的優點就是基于hadoop實現,把很多以前運行于單機上的算法,轉化為了MapReduce模式,這樣大大提升了算法可處理的數據量和處理性能。