PHP的PDF解析庫:PdfParser
PdfParser 是一個標準的 PHP 庫提供個用于從 PDF 文件中抽取數據的工具。它加載 PDF 文件并解析文件中對象、頭和元數據,可抽取其中的文本信息,支持壓縮的 PDF、MAC OS 羅馬字符集編碼、8進制和16進制編碼。兼容 PSR-0 和 PSR-1。功能包括:
- Load/parse objects and headers
- Extract meta data (author, description, ...)
- Extract text from ordered pages
- Support of compressed pdf
- Support of MAC OS Roman charset encoding
- Handling of hexa and octal encoding in text sections
- PSR-0 compliant (autoloader)
- PSR-1 compliant (code styling)
示例代碼:
$document = \Smalot\PdfParser\Document::parseFile('document.pdf'); $pages = $document->getPages(); $text = $pages[1]->getText();
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!