DocToText 0.13.0 發布 - 將文檔轉換為純文本

jopen 12年前發布 | 15K 次閱讀 DocToText

SILVERCODERS DocToText是一個強大的工具,它能夠將很多格式的文檔轉成純文本。它包括一個控制臺應用程序和C / C++庫,允許嵌入到其他應用程序中提供文本抽取功能。

這個工具支持 MS Office 格式:MS Word (DOC), MS Excel (XLS), MS PowerPoint (PPT), Rich Text Format (RTF);OpenDocument (also known as ODF and ISO/IEC 26300, full name: OASIS Open Document Format for Office Applications): text documents (ODT), spreadsheets (ODS), presentations (ODP) and Office Open XML (ISO/IEC 29500, also called OOXML, OpenXML or MSOOXML) documents: MS Word (DOCX), MS Excel (XLSX), MS PowerPoint (PPTX)。

從doc, xls, ppt, rtf, odt, ods, odp, docx, xlsx and pptx等文件中提取文本,可用于搜索,索引和歸檔。 DocToText也可以用作快速的控制臺查看器。

DocToText還可以從已經損壞的OpenDocument 和 Office Open XML 文檔提取文本。

項目主頁:http://silvercoders.com/en/products/doctotext/

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!