微軟重金收購機器學習廠商Equivio為哪般?
根據外媒消息,微軟收購了以色列一家機器學習廠商 Equivio,其擁有的機器學習技術可用于對企業或政府的海量辦公文件、電子郵件進行智能分析和歸類。
大數據時代,機器學習(Machine Learning)成為一個熱門的前沿科技領域。機器學習屬于人工智能的一個分支,專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能, 重新組織已有的知識結構使之不斷改善自身的性能。機器學習過去被認為是屬于研發機構和實驗室的深不可測的新技術,但其實離我們并不那么遙遠。不信,你且 看。
當你使用蘋果的 Siri,或是谷歌的 Google Now,或者是百度語音,甚至是出門問問,來尋找附近的美食餐廳、電影院或者購物廣場時,你所使用的工具背后也使用了機器學習技術。
只是,機器學習技術盡管不如人工智能那么寬泛,但其實也是一個大的技術范圍,未來可能涉及生活的方方面面。微軟收購的 Equivio 公司,其研發的機器學習技術,可以利用分析軟件對大量的非結構性數據和文件進行智能分析,然后進行分組歸類。更準確的叫法,劃分到更細分的分類,應該屬于 文本分析技術(也稱文本挖掘技術)領域。
根據百度百科的定義,文本數據挖掘(Text Mining)是指從文本數據中抽取有價值的信息和知識的計算機處理技術。顧名思義,文本數據挖掘是從文本中進行數據挖掘(Data Mining)。
更加詳細的解釋是:
文本挖掘是信息挖掘的一個研究分支,用于基于文本信息的知識發現。文本挖掘利用智能算法,如神經網絡、基于案例的推理、可能性推理等,并結合文字處 理技術,分析大量的非結構化文本源(如文檔、電子表格、客戶電子郵件、問題查詢、網頁等),抽取或標記關鍵字概念、文字間的關系,并按照內容對文檔進行分 類,獲取有用的知識和信息。
但微軟為什么會收購這么一家公司呢,而且還花費了不小的資金,2 億美刀?
時代的發展和用戶需求的必然
全世界的企業和政府,每天產生海量的數據,數據規模的增長,已經超過了人類手工處理的能力,傳統的搜索、發現相關文件的手段,也已經過時。
鞏固自己在辦公軟件領域的霸主地位
在辦公軟件領域占據優勢的微軟,通過收購 Equivio,有望將文本挖掘帶入到工作人員日常處理的電子郵件和文檔中。一方面可以滿足用戶需求,提升用戶體驗,另一方面,微軟也在通過創新技術保持 競爭力,鞏固自己在辦公軟件領域的霸主地位。在 Office 系列產品中,微軟已經有了 eDiscovery 等信息檢索和整理的功能,未來利用 Equivio 公司的文本挖掘技術,微軟將會讓這些工具更加智能、更加易于使用。
除了微軟, 非死book、谷歌、蘋果都已經設立了團隊進行研發,機器學習技術的發展,也推動了許多互聯網消費者產品的進步。
未來我們很可能在很多領域都使用到文本挖掘技術,甚至是機器學習技術,真正感受科技改變生活。
航空安全領域
數據和文本一樣,都可以通過不同的途徑、運用多樣化的方式進行分析,比如算法式和可視化。通過文本挖掘技術可以幫助各國的航空航天領域的機構能 夠密切關注流行趨勢、事件的增幅減幅以及跑道入侵事故的因素。通過短時間內把所有數據匯集到一起、進行同時分析,能夠對諸如航空系統這樣的真實系統進行高 精確度預測,最終有利于預防和降低事故發生。
金融分析領域
據國外媒體報道,華爾街開始利用程序來讀取各類新聞、社論、公司網站信息、推ter 等,分析其中的詞匯、語法結果、甚至是表情符號,這些程序會判斷解析得到信息對市場的影響,并且自動進行交易。就是典型的用戶交易情緒的挖掘和分析,試想 要是能早一點判斷用戶恐慌性拋售股票,那對很多金融企業是何等的重要。
消費場景推薦
亞馬遜向消費者推薦商品,或者淘寶天貓京東向你推薦商品時,也將用到文本挖掘技術。而推薦的信息依據其可能是你的評論,也可能是一個提問等等。利用文本挖掘技術,來更好地了解用戶的想法,最終實現精準推薦。
實體商場同樣也可以用到,通過網絡信息獲取甚至是線下的客戶意見反饋卡的分析,實現更加的消費場景布局,營造體驗拉動購物。
未來,企業競爭情報、CRM、搜索引擎、醫療、保險和咨詢等等行業都離不開文本挖掘技術。
更多高大上的領域,諸如圖像識別、語音識別、機器翻譯等領域也會用到文本挖掘。
不過文本挖掘技術,甚至是更寬泛的機器學習技術,人工智能技術,都不會在大眾用戶中有較高的認知度和知名度,核心原因在于從來沒有一個單獨的產 品叫人工智能,但無論是自動交易機還是谷歌無人駕駛汽車,都是人工智能在應用層面的體現。不管你記不記得,認知不認知,都無法阻擋文本挖掘技術、機器學習 技術在你生活的方方面面存在著。