微軟Project Oxford幫助開發人員創建更智能的應用
假設你是一名對關于健身的應用充滿奇思妙想的開發人員。在你的理想世界中,它包含各種酷炫的技巧,例如從照片中識別出用戶的臉部,或能夠理解鍛煉者對它所發出的啟動和停止追蹤一段跑步的指令。但是,這些復雜的功能都只能通過某種先進的 機器學習 來實現,而你卻沒有實現它們所需的時間或資源。
“人們在構建自己的應用時,確實不想為這些事情操心,”微軟必應體驗團隊首席項目經理 Meenaz Merchant 表示。
為此,于上周在舊金山舉行的 Build 2015 開發者大會上,微軟提出了一種解決方案,一組被稱為“ Project Oxford ”的技術,將允許開發人員創建更智能的應用,即使這些應用的開發者并非機器學習相關領域的專家,也可以實現人臉識別和自然語言解析等功能。
“作為一名應用開發人員,只要發揮你在 API 上的能力即可,不必擔心機器學習方面的問題,”必應首席團隊項目經理 Vijay Vokkaarne 說道。他的團隊正在研究 Project Oxford 中與語音相關的問題。
該系列服務已經推出了限時免費使用的測試版,其中的很多技術已經在微軟自家產品上使用,如微軟小娜、 Xbox 游戲系統、 One Drive 云存儲和即將發布的 Windows 10 操作系統等。這些服務還可幫助開發人員自動執行那些手工操作太費時費力的任務。例如,視覺方面的服務可以對用戶提交的成千上萬張照片進行分類整理,如過濾出可能包含不雅或其他不適當內容的照片,或者只是找出包含海灘風景的照片,甚至可以根據主色方案對照片進行分組等。
如果你自己動手做這些事情“就會像大海撈針一樣,” Merchant 說道。
無論是 Windows 、 Windows Phone 系統,還是 iOS 或安卓系統,此服務都能夠跨越不同的平臺和編程語言發揮作用。想要使用該系列服務,開發人員需要在微軟云計算平臺 Azure 上創建一個賬戶。
微軟技術研究部門高級項目經理 Ryan Galgon 表示,我們提供上述服務的宗旨,是希望與已經有很多關于產品和服務的好的創意的開發人員分享這些技術。
最初通過限時免費使用的測試版提供這些服務,其中一部分原因是希望更好地了解人們是如何使用這些服務的。“我們希望了解開發人員需要這些服務為他們做什么,” Galgon 說。
這套全新的機器學習系列服務已作為微軟 Azure 產品組合的一部分向開發人員開放。 Project Oxford 目前主要包括以下四個部分:
人臉識別 :這項技術可以自動識別照片上的人臉,對相似的人臉進行分組,并檢查是否完全相同。它可以用于輕松識別出某張照片上出現的用戶,以及允許用戶使用面部認證登錄賬號等。
語音處理 :該技術可以識別語音信息并將其轉換成文字,反之亦然。開發人員可以使用它開發解放我們雙手的工具,如口述聽寫,或者自動讀出指令或其他必要的功能。
可視化工具 :此項服務通過分析視覺內容,查找例如不適宜的內或主配色方案等。它也可以檢測和理解照片中的文字(例如球隊名稱),并可以按照片內容(如海灘、動物或食品等)進行分類。最后,它還可以自動將照片壓縮成一個可辨認的縮略圖,方便瀏覽。
語言理解智能服務( LUIS ): 該服務目前僅供受邀測試,它能幫助應用理解用戶用自然語言或日常口語或鍵入的內容。借助機器學習,讓系統根據經驗更好地預測用戶想要什么,從而明白人們究竟希望應用做什么。
例如在運動應用中,系統可能會學習到,當用戶說“我要開始跑步”“開始跑步”甚至“去跑步”時,意思都是要開始追蹤這個人的移動距離了,而且這種活動的類型就是“跑步”。同樣,像“請停止跑步”“暫停跑步”或“我跑完了”都是在告訴系統應該停止追蹤了。
這套系統建立在一個相對簡單的接口上,所以各種背景的開發人員都可以教會 LUIS 哪些信號需要引發哪些行為。此外,隨著人們使用應用, LUIS 將學會理解人們說這樣的話究竟是什么意思:“我實在受不了啦,停了吧。”
如果你是一名開發人員,并且對 Project Oxford 感興趣,現在就可以一試身手。語音、圖像和人臉識別的試用版工具都已開放使用, LUIS 項目目前僅限受邀人員使用。
相關內容
歡迎關注
微軟亞洲研究院官方網站: http://www.msra.cn
微軟亞洲研究院人人網主頁: http://page.renren.com/600674137
微軟亞洲研究院微博: http://t.sina.com.cn/msra
微軟亞洲研究院微信:搜索“微軟研究院“或掃描下方二維碼 :