前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

jopen 8年前發布 | 9K 次閱讀 微軟 數據挖掘
前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

第九屆 ACM 網絡搜索與數據挖掘國際會議( ACM International Conference on Web Search and Data Mining ,簡稱 WSDM )已于上周( 2 月 22 日 -25 日)在舊金山腹地 Mission Bay 會議中心舉辦。而今年的 WSDM 大會上,有關數字和經濟的名詞將會難舍難分。那些數據和隱藏在數字間的奧秘有時候就像一片等待尋寶人的寶藏,與會者們仿佛拿著數字的鑰匙,轉動了財富的鎖。網絡搜索、大數據、云、風投、經濟這些你早已熟悉的詞將被行業大佬和新秀們重新審視和討論。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

WSDM 涵蓋互聯網和社交網絡的搜索與數據挖掘方面的理論、模型、算法、評測、實驗、應用等多個方面,既重視基礎研究,也重視實際應用。正因為如此, WSDM 越來越具影響力,并已經成為互聯網搜索與數據挖掘領域的頂級國際學術會議,給網絡搜索與數據挖掘領域的專家們提供了一個絕佳的交流平臺。

今年的 WSDM 2016 會議設置了 3 場主題報告, 4 場實踐和經驗特邀報告,論文報告, 5 個研討會, 3 次輔導報告, 1 場博士生論壇。此外,這次會議還特別設立風投產業日,并增加了 WSDM CUP 挑戰賽項目。下面就讓小編帶你走進這場有關搜索與數據的盛會!

永恒的焦點——大會論文

WSDM 極為重視會議論文質量,據了解,本屆會議共收到來自全球 368 篇論文投稿, 67 篇文章入選,接收率僅為 18.2% 。而在這 67 篇論文中,微軟研究院就貢獻了 6 篇,一起來了解一下吧 ~

誰動了我的微博

當你將照片或者文字上傳到微博或朋友圈,也許心中會默默期待那個 TA 的回復和轉發吧!你的自拍或者分享又期待誰的點贊呢?到底誰動了我的社交平臺?微軟研究院的論文 Who Will Reply to/Retweet This Tweet? The Dynamics of Friendships and Online Social Interactions 給出了答案。論文顛覆了把社會紐帶作為一個固定值的思維,進行動態關系討論,并建立了一個模型,預測社交網絡行為。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

在論文中,研究員們收集了超過 7 千萬公開的在線聊天互動的數據,并通過分析微博回復、轉發等互動過程中的所蘊含的時間性、語境的要素,建立了一個預測模型。該模型可以預測如果你的發出一條微博,你的哪些朋友更有可能進行回復和轉發。這項模型不僅揭示了現實關系如何影響網絡社交行為,更為未來的在線社交平臺應用的開發提供一些新的思路。事實上,微軟亞洲研究院的這項工作也是目前為止,第一次從用戶和微博內容上建立關于回復和轉發的預測模型。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

博采百家之言

當你在醫院體檢時,往往需要在不同的科室對身體的各項指征進行檢查。醫生也需要通過綜合多項指標數據才能確定你健康與否。互聯網廣告商業也與此類似,我們也需要考慮用戶、商家、網站信息的一系列信息才能做出最佳的報價評估。因此,在多觀點學習研究中,不同信息觀點之間的建模工作是一大挑戰。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

Multi-view Machines 這篇論文正是基于這項問題提出了一種多視角機( multi-view machines , MVMs ), MVMs 可以被應用到各種各樣的監督機器學習過程當中,并分析源自不同觀點的特征之間是否存在關聯和互動。相比于傳統的模型, MVMs 能夠進行全階相互作用分析,并能夠更好處理稀疏參數估計。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

發散思維找問題

在很多以“提問 - 回答”方式進行互動的網站,例如百度知道,雅虎知識堂等,如果你采用關鍵詞檢索的方法進行查詢,經常會反饋出一些描述極為接近的問題。但事實上,還有很多問題的本質相近,問題描述的文字缺大相徑庭的類似問題,例如“健身時我該如何安排自己的三餐?”與“運動期間需要注意的飲食問題?”這兩個問題都是與運動和飲食相關的同質性問題。對于網站本身的檢索反饋系統來說,如何將這類問題合并與同時呈現給用戶是一個較大的挑戰。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

Learning Distributed Representations of Data in Community Question Answering for Question Retrieval 這篇論文提供了解決該問題的一個新思路。微軟的研究員通過將文字和問題同時嵌入空間向量辦法,尋找不同描述的問題中暗含的聯系,并使用上百萬的數據進行反復訓練,最終建立了一個高效準確的檢索模型。同時,這篇論文中涉及的模型代碼也開源到了 Github ,你可以訪問 https://github.com/ComputerHobbyist/cqa 獲取更多信息。

Multi-Score Position AuctionsOn obtaining effort based judgments for Information retrievalImproving IP Geolocation using Query Logs 三篇論文則在付費廣告拍賣、信息相關性和 IP 地理定位等方向提出了一些新的模型與算法。

產業與學術并進——風投產業日

學術研究的開展離不開產業的支持,產業的革命也依賴學術領域的突破。如何將二者有機的結合在一起,并促進二者共同前進,也是此次 WSDM 大會提出的思考之一。為此, WSDM 2016 創新性地設立了風投產業日。

在活動當日,與會人員主要圍繞了網絡搜索與數據挖掘和風投產業的互動這一議題展開討論。大會還特別邀請了微軟集團全球執行副總裁陸奇博士做了題為“一個新興數字社會的剖析:從產業發展前景窺探未來”( the Anatomy of an Emerging Digital Society: A Look into the Future from an Industrial Development Perspective )的主題演講。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會 ?微軟集團全球執行副總裁 陸奇

IT 行業正在快速進入移動和云的時代,移動設備和云設備正從本質上改寫我們的產業與社會,如何激發我們的潛力并打造出新一代功能更加強大的數字平臺是全球工業界與學術界研究者共同面臨的挑戰。同時這也是一次極大的機遇,而我們期待與你共同挑戰未來。

學術搜索排序的未來—— WSDM CUP

相比于往年的 WSDM 大會,本次大會的新增項目 WSDM CUP 學術搜索挑戰賽環節更是十分引人注目。首屆 WSDM CUP 是由微軟研究院和著名學術出版商 Elsevier 共同舉辦的,以論文搜索排序為題,號召學術界為學術用戶探索出合理有效的論文搜索排序算法,以期改善文獻檢索體驗。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

事實上,對于每個科研人員來說,了解行業內的研究動向十分重要。當某些細分方向某些論文提出了某一新觀點,雖然短時間內相關論文的引用數相對有限,但并不影響學者們對此類論文的重視度。但目前通過關鍵詞進行查詢,出現在搜索結果前幾位的論文往往是那些引用次數較高,但觀點可能不甚新穎的“舊論文”,學術界的新星論文卻不易被學者們獲取。近年來,國內外的學術界也一直在反思以引用數衡量論文質量是否合理,并開始倡導發展更加豐富多元、求真務實的評價機制,但落實到文獻檢索工具,則苦于沒有更為合理的排序策略能夠取代傳統的引用數排序。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

整個 WSDM CUP 分為三個階段,在大會開始之前,參賽者們經過重重篩選,僅有少數參賽隊伍能夠進入決賽。值得一提的是,在學術搜索挑戰賽的第二階段,由初賽中獲勝的八只隊伍優化過的算法進入了微軟必應學術搜索中,面向所用用戶進行了公測。因此,在此期間進入必應學術搜索中進行搜索行為的用戶們,你們的搜索將決定著學術檢索算法的未來。(相關活動信息已在微軟亞洲研究院的微博、微信以及相關網站頁面進行了公開。)

此外,基于此前 WSDM CUP 挑戰賽過程中,部分公測用戶熱情貢獻的建議和想法,微軟學術搜索開發了極具創新性的語義搜索功能,完善智能搜索的新體驗。通過語義搜索技術,搜索引擎的工作不再受限于用戶所輸入查詢的字面本身,而是透過現象了解本質,準確地捕捉到用戶所輸入語句后面的真正意圖,并以此來進行搜索,從而更準確地返回最符合用戶需求的搜索結果。

例如,用戶希望了解學術領域“ speech recognition ”的內容,具體到微軟研究院的洪小文院長( Hsiaowuen Hon )在學術會議( ICASSP )發表過的某篇文章時,可采用如下查詢: papers about speech recognition by hsiaowuen hon in icassp 。該查詢通過語法開關 papers 啟動語義查詢功能,并由語法介詞 by 標示作者, in 標示會議;同時,語法介詞可多次疊加,以優化的搜索結果,如 about 可用來細分領域、 by 標示多個合著作者、 from 標示作者單位或限定作者于某段科研經歷期間發表的論文等等。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

此外,微軟學術搜索還帶來了全新的篩選功能。搜索結果中,與主題相關的內容會分別展示在多維度過濾條件中,供用戶篩選搜索結果。如搜索主題為洪小文 (Hsiaowuen Hon) ,其合著作者、研究領域、發表期刊、參加會議、所在機構等,均可作為篩選條件展示在過濾器中,選中相應條件即可過濾內容,獲取更精準的論文搜索結果。快去試試吧 ~~

BIG 2016 CUP 編程挑戰賽

WSDM CUP 論文搜索挑戰賽只是探索論文排序搜索未來的第一步,如果你還在遺憾過錯了這個改變論文排序搜索未來的機會,那么也許今天剛剛開放報名的 BIG 2016 CUP 你不該錯過。

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

BIG 2016 CUP 是大數據創新收集大會( BigData Innovators Gathering )的一部分,將與 WWW 2016 大會同時進行,關注的焦點主要集中于大數據與網絡領域。此次 BIG 2016 CUP 主要關注的問題是數據庫中論文和作者匹配錯誤的現象。 BIG 2016 CUP 希望參賽者可以從機器學習、信息檢索、圖數據分析等多個角度入手,提供一個可以驗證論文和作者是否匹配的 RESTful 服務端口。

相比于前幾屆 BIG 編程挑戰賽,本次 BIG 2016 CUP 更加鼓勵將數據處理和在線查詢相結合的創新解決方案。微軟則為本次挑戰賽提供了微軟學術圖譜數據集和在線的圖查詢編程接口。如需了解更多詳情,請訪問 http://big2016.org/big-2016-cup/

相關報名地址: https://cmt3.research.microsoft.com/User/Login?ReturnUrl=/BIG2016

推薦閱讀:

【年度學術大會合集】SIGGRAPH,KDD,AAAI,NIPS…這些你想參加的會議

從第一步,到每一步:微軟學術搜索

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會

歡迎關注

微軟亞洲研究院官方網站:http://www.msra.cn

微軟亞洲研究院人人網主頁:http://page.renren.com/600674137

微軟亞洲研究院微博:http://t.sina.com.cn/msra

微軟亞洲研究院微信:搜索“微軟研究院“或掃描下方二維碼:

前沿理論、反思創新、產學結合——你不能錯過的WSDM 2016大會
</div>

來自: http://blog.sina.com.cn/s/blog_4caedc7a0102w6v3.html

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!