谷歌圖像識別最新進展：可對圖片場景進行準確描述

jopen 11年前發布 | 6K 次閱讀谷歌

來自谷歌研究院的科學家發表了一篇博文，展示了谷歌在圖形識別領域的最新研究進展。或許未來谷歌的圖形識別引擎不僅僅能夠識別出照片的對象，還能夠對整個場景進行簡短而準確的描述。這個突破性概念來自于機器語言翻譯方面的研究成果：通過一種遞歸神經網絡（RNN）將一種語言的語句轉換成向量表達，并采用第二個 RNN 將向量表達轉換成目標語言的語句。

而谷歌將以上過程中的第一種 RNN 用深度卷積神經網絡 CNN 取代，這種網絡可以用來識別圖像中的物體。通過此種方法，就可以實現將圖像中的對象轉換成語句，對圖像場景進行描述。概念雖然簡單，但是實現起來十分復雜，科學家表示目前實驗產生的語句合理性不錯，但距離完美仍有差距，這項研究目前僅處于早期階段。比如下述例子展示了通過此方法識別圖像對象，并產生描述的過程。

谷歌圖像識別最新進展：可對圖片場景進行準確描述

來自: cnBeta

                    <span id="shareA4" class="fl">                  
                        </span>

</div>

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/news/view/153f10d

谷歌

谷歌圖像識別最新進展：可對圖片場景進行準確描述

相關資訊

相關經驗

相關文檔