深度學習和拓撲數據分析的六大驚人之舉

cnffe 9年前發布 | 7K 次閱讀 深度學習

英文原文:6 crazy things Deep Learning and Topological Data Analysis can do with

假如你有一個一千列和一百萬行的數據集。無論你從哪個角度看它——小型,中型或大型的數據——你不可能看到它的全貌。將它放大或縮小。使它能夠 在一個屏幕里顯示完全。由于人的本質,如果能夠看到事物的全局的話,我們就會有更好的理解。有沒有辦法把數據都放到一張圖里,讓你可以像觀察地圖一樣觀察 數據呢?

將深度學習與拓撲數據分析結合在一起完全能夠達到此目的,并且還綽綽有余。

1、它能在幾分鐘內創建一張數據圖,其中每一個點都是一個數據項或一組類似的數據項。

基于數據項的相關性和學習模式,系統將類似的數據項組合在一起。這將使數據有唯一的表示方式,并且會讓你更清晰地洞察數據。可視化圖中的節點由一個或多個數據點構成,而點與點之間的鏈接則代表數據項之間高相似性。

深度學習和拓撲數據分析的六大驚人之舉

2、它展示了數據中的模式,這是使用傳統商業智能無法識別的。

下面是個案例,展示的是算法是如何僅僅通過分析用戶行為來識別兩組不同的人群。典型的特征區分,黃色和藍色點:女性和男性。

深度學習和拓撲數據分析的六大驚人之舉

如果我們分析行為類型,我們會發現,其中一組大部分是發送信息(男性),而另一組則多為接收信息(女性)。

深度學習和拓撲數據分析的六大驚人之舉

3、它能在多層面上識別分段數據

分段數據表現在多種層面上——從高層次分類到具有相同數據項的分組。

在一個 Netflix 數據集的例子中,每個數據項是一部電影。最高層次的一組是音樂,孩子,外交和成人電影。中層次的部分包含不同分段:從印度片和港片到驚悚片和恐怖片。在低層次中是電視連續劇分組,比如“萬能管家”,“辦公室”,“神秘博士”等。

深度學習和拓撲數據分析的六大驚人之舉

4、它能分析任何數據:文本,圖像,傳感器數據,甚至音頻數據。

任何數據都可以被分段并理解,如果可以將它展現為數字矩陣,其中每一行是一個數據項,列是一個參數。下面這些是最常見的用例:

深度學習和拓撲數據分析的六大驚人之舉

5、如果你引導它,它能學習更復雜的依賴關系。

選擇一組數據項,將它們分組,算法就會發現所有相關或類似的數據項。重復這個過程數次,那么神經網絡可以學習到它們之間的差異,比如 Mac 硬件,PC 硬件和一般電子文本的差異。

對 20000 篇屬于 20 個不同主題的文章進行了初步分析,得出一個密集的點云圖(左圖)。在使用深度學習迭代幾次之后,算法會將它們進行分類,錯誤率僅僅 1.2%(右圖)。

深度學習和拓撲數據分析的六大驚人之舉

6、即使沒有監督它也能夠學習

深度學習和自編碼器模擬了人類大腦活動,并且能夠在數據集中自動識別高層次的模式。例如,在谷歌大腦計劃中,自編碼器通過“觀看”一千萬條 油Tube 視頻截取的數字圖像,成功地學習并識別出人和貓臉:

深度學習和拓撲數據分析的六大驚人之舉

我最近在使用拓撲數據分析和深度學習,并開發出一套工具,它將這些技術轉換成了一個用戶友好型界面,能夠讓人們觀察數據并發現潛在聯系。去這個網站看看,并讓我知道你是否愿意創建你自己數據的地圖。

譯者/劉翔宇審校/劉帝偉、朱正貴責編/周建丁

來自: www.iteye.com
 本文由用戶 cnffe 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!