Google的PageRank算法無所不能?
英文原文:How Google's PageRank Quantifies Things (Like History's Best Tennis Player) Beyond The Web
1998 年,兩個名不見經傳的研究生,Larry Page 和 Sergey Brin,第一次在學術論文上介紹了 Google 這個搜索引擎,而關鍵創新點就在于他們發明的名叫 PageRank 的算法(PageRank 是 Larry Page 的 Page,而不是網頁的意思)。Google 正是依據 PageRank 算法將搜索到的網站進行排序,正如他們二人所說的:PageRank“帶來了網頁新秩序。”
PageRank 將網站的鏈接和超鏈接作為指標,衡量其重要性和權威性。然后 Google 根據此信息來排列搜索結果。Page 和 Brin 發表的分析結果,并不只是當時現有數學的一個新的應用,學者們認為,他們找到的是一個全新的方法,雖然可能有借鑒一些前人的成果。
雖然 Google 對 PageRank 提供搜索結果的依賴程度到底有多少,只有公司內部的人才知道,但是,可以肯定的是,該算法對 Google 現在數千億的市值起到了不可磨滅的作用。
而 PageRank 在網頁之外,也具有驚人的大范圍的實用性,幾乎涵蓋所有領域,從體育團隊的排名到大腦內部交互聯結的分析。
普渡大學的計算機學家 David Gleich 這么評價道:“它有點像是 Google 發明的鏡頭。如果你有各種不同的鏡頭隨機組合,你就可以觀察到各種不同的系統——就像是你同時有了顯微鏡,望遠鏡,數碼相機等等。但你還是需要有自己獨特的視角。”
自動論文發表以后,十六年來,Gleich 一直在研究 PageRank 算法在其他領域的應用。他已經發現了數十種可以使用該算法的具體案例。他的做法并不是深入研究每一個實例的具體實現,而是為了證明 PageRank 確實擁有廣大的適用范圍。
他說,只要有圖譜,就有 PageRank 的用武之地。它是一種數學的思維方式,代表了一組事物的關系或流程,研究對象可以是 Web 頁面,辦公室工作人員,非死book 的用戶,基因,蛋白質或者交通情況。“PageRank 就像各種圖譜一樣,無處不在。”
以下是一些有趣的使用案例。目前,這些對 Google 的商業或社會影響并沒有產生什么作用,但也不排除會有這么一天。
文學作品
最重要的文學作品是什么?PageRank 算法可以幫助回答這個看似很主觀的問題。Nebraska 大學的一位文學教授開發了一款軟件,使用了 PageRank 和其他的算法。他的研究對象是十九世紀的文學作家。經過分析了近 3600 部長篇小說,軟件得出了結論:簡·奧斯丁和沃爾特·司各特是那個年代最有影響力的作家。
體育運動
在特定的運動項目中,誰是歷史上最好的球隊或球員?這個問題如果交給球迷,那必將吵得不可開交,因為評判標準同樣是主觀的。有一則論文利用 PageRank 分析了 1968 年之后的所有職業網球比賽,它將相同的兩個對手之間的比賽結果進行匹配,以“聲望得分”為基礎構建了一個網絡。得出的結論是,在網球界,Jimmy Connors 是史上最好的球員。就像 Gleich 說的,這些排名背后的基本思想是:假設一個粉絲會追隨著一只球隊或球員,直到他被打敗,而后他會繼續追隨勝利的一方,直到結果出現。這類似于網上沖浪者在 網站鏈接中做出選擇。
神經科學
Gleich 在他的論文中寫道:“人類的大腦是一個重要的網絡,可我們對它的了解少的可憐”。PageRank 當然也適用于此。最近,它被用來評估不同大腦區域之間的聯結和重要性,以及隨著年齡的變化結果會如何改變。
癌癥研究
在一篇名為“Google Goes Cancer”的論文里,研究人員開發了一種基于 Google 算法的“新型計算方法”,該算法幫助他們確定了七個與遺傳有關的腫瘤基因,這將幫助醫生更好的指導癌癥治療的過程。
交通網絡
PageRank 的另一應用是用來預測城市里的交通流量和人流動向。有一項研究依賴于該算法的一個關鍵因素:一個叫做 teleporting(傳送)的概念,它模擬了人類的決定:開始或中止行程,或者在既定的街道停車。這有助于交通運輸研究人員更好的創建測量模型,模擬 道路的車流量和人流量。
<span id="shareA4" class="fl">
</span>