mahout in Action2.2-給用戶推薦圖書(2)-分析對用戶推薦書目的結果
2.2.3 Analyzing the output
在之前的程序運行結果中我們得到的結果輸出是:
RecommendedItem [item:104, value:4.257081]
程序要求選擇一個最適合的,排名最考前的書目給用戶1,結果給出來了,就是104,原因是因為評分達到了4.25.這個是所有書目里面分數最高的了。
我們再次結合之前的圖來進行分析:

書目107沒有沒推薦出來,雖然107也是可以推薦的,但是推薦的情形應該是有那些有相反的喜好的用戶。因為用戶3和用戶1的喜好是相反的。
選擇出來了104,而沒有選擇106,這樣也是很有道理的,因為104相比106,有更高的評分。
很明顯,通過原始數據我們很難判斷哪個書是比較適合用戶1的,但是我們的推薦系統通過精細的計算,給出了一個比較滿意有意義的答案,經得起推敲。 正是這種特性,我們才會愛上機器學習。
但是在現實中,我們面對的原始數據可能會很大很多,而且充滿噪音。譬如說,對于一本書的評價,可能包含用戶對他的點擊,閱讀,停留時間等等,但是很多這樣的數據都不是特別精確,可能用戶是誤點擊,或者點擊了但是不一定稀罕他,所以這種情況就不應該被計算在里面。
因此我們必須明白,通過這樣的數據我們的確可以簡單的獲取我們想要的結果推薦,并且不會很繁瑣。但是我們要明白,這樣標準的操作流程會導致差強人意的結果。在后面的某一個時間會進一步解釋我們如何通過調配系統來獲得精準的推薦結果。
下面是程序運行的簡要流程圖:

1.君子應該‘有所為有所不為’,每個人的精力都是有限的,不能盡善盡美,選擇最重要的最緊要的事情來做,深化。
2.失去了夢想,失去了激情,失去對很多事情的向往,沒有了之前的豪情,對妹子的渴望也已不再。但是俺對開心的向往,對財務自由的向往永遠不會失去。愛親人愛自己,活著也很有價值。
3.每一天都沒什么事干,日子也不能白過,不能在這里坐等過年。重拾Hadoop,mahout算法分析搞起來。
4.年紀不大不小的時候,千萬不要心浮氣躁,欲速不達。一切都要平常心,心平氣和,與人為善,助人為樂,遵守社會的傳統。
5.不要太貪婪,前世因今生果,要敬畏。若水的品質雖不能做到,但是俺往這邊靠,不爭不搶不急躁,一定可以拿到自己想要拿到的。
Charles 于2015-12-18 Phnom Penh
</span></div>
版權說明:
本文由Charles Dong原創,本人支持開源以及免費有益的傳播,反對商業化謀利。
CSDN博客:http://blog.csdn.net/mrcharles
</div>
個人站:http://blog.xingbod.cn
EMAIL:charles@xingbod.cn
</div>
來自: http://blog.csdn.net//mrcharles/article/details/50357261
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!