Google工程師將語言翻譯變成向量空間數學問題

jopen 11年前發布 | 5K 次閱讀 Google

現有的基于統計翻譯的在線工具如巴比魚和Google翻譯,翻譯的結果勉強可用,但離完美還相去甚遠。現在,Google工程師在預印 本網站上發表論文,介紹了一種不依賴于統計翻譯的新技術。他們的方法是將語言翻譯變成向量空間數學問題,利用數據挖掘技術建模一種語言的結構,然后與另一 種語言的結構進行對比。

Google工程師將語言翻譯變成向量空間數學問題

新 的方法是基于一個概念,即每一種語言都有一套相似的理念,因而使用單詞的方式也存在相似性。例如,大多數語言中都有描述相同動物的單詞,如狗、貓和牛,這 些單詞很可能以相同的方式在句子中使用,如“貓是一種比狗小的動物”。語言中單詞之間的關系集合被稱為“語言空間”,可類比為一個點到另一個點的向量集 合,能以數學的方式進行處理,例如王減去男性加上女性等于女王(‘king’–‘man’+‘woman’=‘queen’)。在向量空間中,許多語言都 有共通之處,可以利用向量空間線性變換將一種語言翻譯成另一種語言。Google工程師表示,新的方法非常有效。

載自: Solidot

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!