文件的元數據提取庫,GNU libextractor 1.0.0 發布

jopen 12年前發布 | 6K 次閱讀 C語言

libextractor是一個庫,用于從任意類型的文件中提取元數據。其目的是為開發人員提供一個通用庫,在文件共享網絡,文件管理器,WWW索引機器人等使用場景中可以獲得有關文件的元數據。它包括了一個shell命令,并為Java(JNI)和Python提供綁定。

這次是主是插件機制的重大變化,現在允許進程外插件完全隨機訪問整個文件。大部分插件都已經采用新的插件API進行了重構。外部(libextractor)API保持不變,兼容0.6。在重寫的一部分,許多插件被改變,使用標準的第三方的庫進行解析(包括:libjpeg, libtiff, libgif, libtidy,和 libmagic)。基于GStreamer的一個新的插件來取代許多現有的多媒體插件。 幾乎所有的插件都有編寫自動化測試的用例,相應的文檔也有更新。

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!