S4是Yahoo!發布的一個開源通用、分布式、可擴展、部分容錯、具備可插拔功能的平臺。這套平臺主要是為了方便開發者開發處理流式數據(continuous unbounded streams of data)的應用。Yahoo!之所以開發S4系統,主要是為了解決它現實的問題:搜索廣告的展現。搜索廣告是當前各大搜索引擎的主要收入來源,用戶發出查詢請求,搜索引擎在返回正常結果的同時也會返回相關廣告,而廣告是按照點擊付費。為了在最好的位置,放置最相關(也就是用戶最有可能點擊)的廣告,各大搜索引擎使用了大量的數據挖掘和機器學習算法來進行相關性計算,以便提高收入,滿足用戶需求。其中很重要的一點就是要不斷分析用戶的點擊反饋,以便捕獲用戶的行為。S4最初主要還只是用來處理用戶的點擊反饋。
<DIV class=date>收錄時間:2011-03-30 09:04:05</DIV>
本文由用戶 碼頭工人自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!