復旦大學推出基于云的自然語言處理開源項目FudanNLP
在上海復旦大學計算機學院邱錫鵬教授的帶領下,該學院研發出一套基于機器學習的中文自然語言文本處理開發工具包——復旦自然語言處理(FNLP),該工具包包含了為實現這些任務的機器學習算法和數據集。
幾分鐘內,在 100 萬條用戶反饋中篩選出有價值的用戶需求;1 秒鐘內,各種在線機器人的對來自世界各地的用戶問題的即時響應;類似以上這些神奇場景的背后,都有著自然語言處理(Natural Language Processing,簡稱 NLP)的深度應用。
在上海復旦大學計算機學院邱錫鵬教授的帶領下,該學院研發出了一套基于機器學習的中文自然語言文本處理的開發工具包——復旦自然語言處理(FudanNLP ,簡稱 FNLP)。該工具包包含了為實現這些任務的機器學習算法和數據集。
FNLP 所具有的訓練、自我學習及其強大的語義分析能力,其對所部屬的服務器的計算能力,數據的可靠性,訪問性能,有著較高的要求。為了可以讓更多的人了解、使用 FNLP,降低 FNLP 的部署、維護的成本,降低運用復旦自然語言處理的門檻,上海云角信息技術科技有限公司(微博:@云角 YunGoal)的云計算專家團隊幫助復旦與微軟將 FNLP 和與 Microsoft Azure 結合,基于 FNLP 的開源包,在 Microsoft Azure 上搭建了一個中文語言文本處理的平臺——NLP on Azure。
對于想預覽或者運用 FNLP 的用戶,利用了 Microsoft Azure,就可以在幾分種內完成 NLP on Azure Website 的部署,立即開始對 FNLP 各種特性的試用。或者以 REST API 的形式調用 FNLP 的語言分析功能。
NLP on Azure 平臺的功能主要由 3 部分組成:
- 從 web 頁面直接輸入文本,用于基礎的文本分析測試。提供的功能有分詞,詞性標注,關鍵字提取,語法分析,文本分類,文本聚類等功能。
- 提交大規模的文本分析任務,用于大規模文本的分析,以及用對 FNLP 的訓練。
- 以 REST API 的形式,開發調用接口。
更加詳細的使用、部署、開發信息,請參考項目文件夾下的使用及開發部署文檔。
目前云角已將 NLP on Azure 項目代碼和部署包托管到 CSDN CODE 這個平臺。NLP on Azure 項目遵循 Apache Licene 2.0 協議,希望能通過 NLP on Azure 平臺上充分享受 Azure 帶來的各種云服務優勢,以及 FNLP 的強大語言處理功能。
NLP on Azure 項目托管地址:https://code.csdn.net/Yungoal-Research/azure_nlp/tree/master
使用及開發文檔:https://code.csdn.net/Yungoal-Research/azure_nlp/tree/master/Documents
<span id="shareA4" class="fl">
</span> </div>