自動化取代人力,Google建全球最大知識庫
英文原文:Google’s fact-checking bots build vast knowledge bank
搜索引擎巨人 Google 正建立一個自動化的知識庫(Knowledge Vault),透過演算法自動爬梳網絡上的資訊,并利用機器學習將資訊整合成知識,兼具廣度與精度,讓電腦與智能手機了解人類的提問,未來有望改進 Google 回答問題的方式,從原本列出一連串的搜索結果,進化到一目了然的答案。
Knowledge Vault 的前身是 2012 年 Google 所發布的“知識圖表”(Knowledge Graph),一個將資訊結構化的數據庫,透過群眾外包的力量擴大訊息量,內容取自維基百科、CIA 的世界概觀(World Factboo)與協作知識庫 Freebase,內容包羅萬象,有名人、事件等,總共匯整了 5 億個條目及 35 億種事實描述。但最終 Google 發現人的力量還是有限,知識量的擴增出現停滯,于是 Google 改弦易轍,決定以自動搜集的過程取代人力。
到目前為止,Knowledge Vault 已建置了 16 億種事實描述,其中 2.71 億被評比為可信賴的事實,Google 將新事實與已掌握的知識進行交叉比對,發現準確性達 90%。雖然目前 Knowledge Vault 的知識量還未達到知識圖表的水準,但它能自動擴充增加知識,超越的時間指日可待,很快的將成為全球最豐富的知識數據庫。
Google 除了能從網頁上分析文本找尋事實,來喂養它的數據庫,也能抓到一般臺面上看不到的資料,例如 Amazon 的產品銷售數據,或瀏覽某項產品的人數等。Garntner 的技術分析師奧斯丁(Tom Austin)表示,幾家世界上最大的科技公司如 Google、微軟、非死book、Amazon 和 IBM 等,都在打造類似的知識庫,并處理極為龐大復雜的問題。他表示:宕機器能掌握全人類的知識,它的智力將遠遠超過現有的語音助理軟件,在不久的將來,我們會 看到能判斷優先順序的電子信箱問世,它能夠找到最重要的 10 封郵件,然后在不用人類的幫忙下,自動處理完剩下的郵件。
<span id="shareA4" class="fl">
</span>
</div>