什么是:人工智能\機器學習\自然語言\數據挖掘
什么是:人工智能\機器學習\自然語言\數據挖掘
人工智能(AI)是一個大方向,機器學習可以看作是數學算法,這些算法可以作為實現人工智能的一個有效途徑、方法,即作為AI的一個 組成部分。但是人工智能的實現也有別的途徑,機器學習的算法和思想也不局限于人工智能。
機器學習(ML)可以看作是數學算法,但具體說來,又有淺層學習,包括BP算法、SVM;還有興起于2006年的深度學習,是現在研究的熱點 ,包括基于稀疏編碼、神經網絡、基于玻爾茲曼機的不同深度學習算法。
自然語言處理(NLP)是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種 理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用 的語言,所以它與語言學的研究有著密切的聯系,但又有重要的區別。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實 現自然語言通信的計算機系統,特別是其中的軟件系統。因而它是計算機科學的一部分。
自然語言處理(NLP)是計算機科學,人工智能,語言學關注計算機和人類(自然)語言之間的相互作用的領域。在自然語言處理(NLP) 上應用深度神經網絡,將會得到極其顯著的成果。
1)NLTK
NLTK(natural language toolkit)是python的自然語言處理工具包。2001年推出,至今發展非常活躍。它的主要作用是為了教學,至今已 經在20多個國家60多所高校使用,里面包括了大量的詞料庫,以及自然語言處理方面的算法實現:分詞, 詞根計算, 分類, 語義分析等 。
項目主頁: http://nltk.org/
2)FNLP
基于機器學習的中文自然語言文本處理開發工具包——復旦自然語言處理(FNLP)
學習資料:
https://code.csdn.net/Yungoal-Research/azure_nlp/tree/master/Documents
深度學習、自然語言處理和表征方法
http://blog.jobbole.com/77709/