斯坦福大學發布免費在線文本分析工具

jopen 10年前發布 | 13K 次閱讀 文本分析工具

  斯坦福計算機科學家開發了 etcML(Easy Text Classification with Machine Learning)網站,該網站通過機器學習引擎進行文本分析,目前該網站向所有人免費開放。

  維基百科對機器學習的解釋是:他是人工智能的分支之一,是一套能夠從數據中學習的系統。

  斯坦福大學官網對此進行了說明:etcML 網站基于成熟的文本分析引擎,估計總體的情感傾向(是消極還是積極)。etcML 項目負責人 Richard Socher 表示:

“我們想開發一套供普通人和研究人員使用的標準的機器學習技術,所有使用者都不需要編程能力。”

  斯坦福大學候選博士研究生 Rebecca Weiss 表示:

etcML 提供了一種簡單的方式,對單詞和短語所體現的觀點進行分類。

我可以訓練分類器,也可以對任何一段文本打上標簽,實現這一切并不需要寫一行代碼。我還可以和記者或研究人員分享我的分類器。

  斯坦福大學計算機語言學研究者 Rob Voigt 通過 etcML 對 Kickstarter(一個創意方案眾籌平臺)上的項目進行評估。他發現,多使用“我們”、“我們的”這些復數代詞能夠提高項目宣講成功的概率。Voigt 表示:

“我們并沒有聲稱我們的分析是決定性的,etcML 分類范式提供了有價值的成功線索。”

  斯坦福大學計算機科學博士生 Chinmay Kulkarni 使用 etcML 對 2000 名學生的簡答題測驗進行打分。此前,簡答題打分是通過學生之間的互相打分完成的,平局每道題有 4 個學生進行打分。通過 etcML 打分后,平局每道題只需要 3 個或更少的學生打分。Kulkarni 表示:

“我們獲得了同樣的精確度,同時減少了學生的負擔。”

  Kulkarni 發布了這一項目的論文

  Socher 認為 etcML 能吸引許多人嘗試有趣的語義分析項目并提供反饋,從而提升 etcML 背后的計算引擎。

  值得一提的是,Andrew Ng(吳恩達)是 etcML 項目的顧問,他是斯坦福人工智能實驗室的主管,也是在線公開課程平臺 Coursera 的創始人之一。

來自: InfoQ
                    <span id="shareA4" class="fl">                          </span>                 </div>
 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!