維基百科的下一個大動作:維基數據,一個機器可讀、用戶可編輯的超大知識數據庫
距離年初維基百科向全球募集資金一事已過去一段時間,維基百科再一次從人們視野的中心消失。一段沉寂過后,維基基金會披露了維基百科的下一個大動作,實施“維基數據”(Wikidata)項目,打造一個機器可讀、用戶可編輯的超大知識數據。
如果稍加留心,就會發現今年 2 月在柏林舉行的語義技術與商業峰會上,維基基金會就向外界展示了維基數據項目的存在。現在,維基基金會公布了更多細節。維基數據項目的目的是建立一個機器 可讀、用戶可編輯的,基于語義的超大知識數據庫。當然,維基數據仍然會以免費知識共享(Creative Commons)的授權形式發布,數據可供任何外部應用調用。
維基數據將會收錄全球不同本地化版本維基百科中那些具有共同認識的條目。共同條目的收錄,在英文、德文、法文和荷蘭文版本的維基百科中比較容易 實現,它們的條目內容差異不大,只是表達運用的語言不同。其他語言的維基百科因條目存在巨大差異性,整合過程將比前 4 個版本維基百科要慢。維基數據還將收錄用戶提出的各類型的問題,自動編制成問題列表。反觀現在的維基百科,用戶提出的各類型的問題,都需要人工創建問題列 表進行匯集,問題的答案也有賴于人工添加。
現在,這項龐大的項目已經開始動工,負責實施這項重大任務的是維基百科德國分部。維基百科德國分部完成相應的工作后,將把維基數據運營和維護的 主管權力移交給維基基金會。整個工程計劃分 3 階段進行,涉及為每條維基百科條目創建一個維基數據頁面,統一格式化數據的來源,創建問題列表等諸多繁雜的工作,預計在明年 3 月完工,屆時維基數據將移交給維基基金會。
目前,維基數據已經收到了 130 萬歐元的贊助,其中半數來自微軟聯合創始人保羅艾倫于 2010 年創立的人工智能研究機構,還有四分之一的贊助來自 Gordon Betty Moore 基金會 ,另外四分之一的贊助則由 Google 提供。
Pic via TC