斯坦福大學發布免費在線文本分析工具
斯坦福計算機科學家開發了 etcML(Easy Text Classification with Machine Learning)網站,該網站通過機器學習引擎進行文本分析,目前該網站向所有人免費開放。
維基百科對機器學習的解釋是:他是人工智能的分支之一,是一套能夠從數據中學習的系統。
斯坦福大學官網對此進行了說明:etcML 網站基于成熟的文本分析引擎,估計總體的情感傾向(是消極還是積極)。etcML 項目負責人 Richard Socher 表示:
“我們想開發一套供普通人和研究人員使用的標準的機器學習技術,所有使用者都不需要編程能力。”
斯坦福大學候選博士研究生 Rebecca Weiss 表示:
etcML 提供了一種簡單的方式,對單詞和短語所體現的觀點進行分類。
我可以訓練分類器,也可以對任何一段文本打上標簽,實現這一切并不需要寫一行代碼。我還可以和記者或研究人員分享我的分類器。
斯坦福大學計算機語言學研究者 Rob Voigt 通過 etcML 對 Kickstarter(一個創意方案眾籌平臺)上的項目進行評估。他發現,多使用“我們”、“我們的”這些復數代詞能夠提高項目宣講成功的概率。Voigt 表示:
“我們并沒有聲稱我們的分析是決定性的,etcML 分類范式提供了有價值的成功線索。”
斯坦福大學計算機科學博士生 Chinmay Kulkarni 使用 etcML 對 2000 名學生的簡答題測驗進行打分。此前,簡答題打分是通過學生之間的互相打分完成的,平局每道題有 4 個學生進行打分。通過 etcML 打分后,平局每道題只需要 3 個或更少的學生打分。Kulkarni 表示:
“我們獲得了同樣的精確度,同時減少了學生的負擔。”
Kulkarni 發布了這一項目的論文。
Socher 認為 etcML 能吸引許多人嘗試有趣的語義分析項目并提供反饋,從而提升 etcML 背后的計算引擎。
值得一提的是,Andrew Ng(吳恩達)是 etcML 項目的顧問,他是斯坦福人工智能實驗室的主管,也是在線公開課程平臺 Coursera 的創始人之一。
<span id="shareA4" class="fl"> </span> </div>