谷歌圖像識別最新進展:可對圖片場景進行準確描述
來自谷歌研究院的科學家發表了一篇博文,展示了谷歌在圖形識別領域的最新研究進展。或許未來谷歌的圖形識別引擎不僅僅能夠識別出照片 的對象,還能夠對整個場景進行簡短而準確的描述。這個突破性概念來自于機器語言翻譯方面的研究成果:通過一種遞歸神經網絡(RNN)將一種語言的語句轉換 成向量表達,并采用第二個 RNN 將向量表達轉換成目標語言的語句。
而谷歌將以上過程中的第一種 RNN 用深度卷積神經網絡 CNN 取代,這種網絡可以用來識別圖像中的物體。通過此種方法,就可以實現將圖像中的對象轉換成語句,對圖像場景進行描述。概念雖然簡單,但是實現起來十分復 雜,科學家表示目前實驗產生的語句合理性不錯,但距離完美仍有差距,這項研究目前僅處于早期階段。比如下述例子展示了通過此方法識別圖像對象,并產生描述 的過程。
來自: cnBeta
<span id="shareA4" class="fl">
</span>
</div>
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!