PHP的PDF解析庫:PdfParser

jopen 11年前發布 | 37K 次閱讀 PdfParser PDF工具包

PdfParser 是一個標準的 PHP 庫提供個用于從 PDF 文件中抽取數據的工具。它加載 PDF 文件并解析文件中對象、頭和元數據,可抽取其中的文本信息,支持壓縮的 PDF、MAC OS 羅馬字符集編碼、8進制和16進制編碼。兼容 PSR-0 和 PSR-1。功能包括:

  • Load/parse objects and headers
  • Extract meta data (author, description, ...)
  • Extract text from ordered pages
  • Support of compressed pdf
  • Support of MAC OS Roman charset encoding
  • Handling of hexa and octal encoding in text sections
  • PSR-0 compliant (autoloader)
  • PSR-1 compliant (code styling)

示例代碼:

$document = \Smalot\PdfParser\Document::parseFile('document.pdf');
$pages    = $document->getPages();
$text     = $pages[1]->getText();

項目主頁:http://www.baiduhome.net/lib/view/home/1378364958500

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!