文本自動摘要工具 TextTeaser 開源
文本自動摘要API TextTeaser日前開源,登陸GitHub。TechCrunch早在2013年10月對TextTeaser進行過最早的報道。其創造者霍洛?巴爾賓(Jolo Balbin)表示,在“發現一些擴展問題,特別是API中的問題后”,他決定將TextTeaser代碼開源。
于是他撤下API,對TextTeaser進行重構,以加快了它的自動摘要速度。開發者可以從兩套方案中進行選擇,包括每摘要1000篇文章付費12美元的方案。第二種方案針對企業,費用為每月250美元,會有專門的服務器存儲文章來源。這意味著每當人們使用該工具對文章摘要,TextTeaser就能獲知文本中的關鍵字,并利用這類信息來改善它的效果。
“透過這一TextTeaser,你可以訓練你自己的摘要工具。”巴爾賓解釋道,“你可以提供文章的類別和來源,用以改進摘要的質量。未來,用戶可能也將能夠提供哪些關鍵字重要哪些不重要方面的信息。”
開發者已經將TextTeaser整合到包括Gist在內的多款新聞閱讀類應用當中。巴爾賓還計劃針對財務、醫療和法律方面的文件優化TextTeaser,那些領域的文件往往非常冗長,易讀性低。
如想了解下TextTeaser的功能與效果,可以看看它對《饑餓游戲》的摘要以及巴爾賓的這篇博文。(譯:羽騰)
來自:TechCrunch
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!