mahout基于用戶推薦的簡單例子(2)

jopen 8年前發布 | 8K 次閱讀 機器學習


首先是封裝了一個給予用戶的推薦,用的相似度算法還是皮爾遜相似度,其他的也可以封裝。


package com.liuxinquan.utils;

import java.io.File;
import java.io.IOException;
import java.util.List;

import org.apache.mahout.cf.taste.common.TasteException;
import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;
import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;
import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;
import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;
import org.apache.mahout.cf.taste.model.DataModel;
import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;
import org.apache.mahout.cf.taste.recommender.RecommendedItem;
import org.apache.mahout.cf.taste.recommender.Recommender;
import org.apache.mahout.cf.taste.similarity.UserSimilarity;

public class UserPersonSim {
    public static List<RecommendedItem> userRec(String filePath, int nearCnt, int userId, int recCnt) {
        try {
            DataModel model = new FileDataModel(new File(filePath));
            UserSimilarity similarity = new PearsonCorrelationSimilarity(model);
            UserNeighborhood neighborhood = new NearestNUserNeighborhood(nearCnt, similarity, model);
            Recommender recommender = new GenericUserBasedRecommender(model, neighborhood, similarity);
            List<RecommendedItem> recommendations = recommender.recommend(userId, recCnt);
            return recommendations;
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (TasteException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        return null;
    }
}



4個參數:filePath---------要分析的數據文件.csv

nearcnt---------推薦給用戶的最近的一組數據個數

userid------推薦用戶id

reccnt-------推薦給用戶的個數

具體使用:

package com.liuxinquan.recommmder;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import org.apache.mahout.cf.taste.recommender.RecommendedItem;

import com.liuxinquan.utils.UserPersonSim;

public class UserRecommder {

    public static void main(String[] args) {
        HashMap<String, String> map = new HashMap<>();
        map.put("101", "橘子");
        map.put("102", "蘋果");
        map.put("103", "香蕉");
        map.put("104", "梨");
        map.put("105", "西瓜");
        map.put("106", "哈密瓜");
        map.put("107", "葡萄");
        String filePath = "xxx/intro.csv";
        for (RecommendedItem item : UserPersonSim.userRec(filePath, 2, 1, 1)) {
            System.out.println(map.get(item.getItemID() + ""));
        }
    }

}
結果:梨

和上一篇的104是對應的。這樣更貼近實際應用,也給大家提供了一種思路。在實際中不可能都是數據格式的,更常見的是: 張三:梨。這就需要我們制定一種規則,先從現實中抽象出來物體的特征:比方一本書的作者、出版商、出版日期等,用數字把特征對應起來后在還原。



來自: http://my.oschina.net/liuxinquan/blog/596869

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!