itext讀取PDF

openkk 13年前發布 | 4K 次閱讀
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import org.pdfbox.pdfparser.PDFParser;
import org.pdfbox.pdmodel.PDDocument;
import org.pdfbox.util.PDFTextStripper;
/**
 *
 * @author 劉毅
 * @date 2010-2-24
 * @ClassName ReaderForPDF.java
 * @Email liu_yi126@163.com
 * @param 讀取PDF
 * @param
 */
public class ReaderForPDF {
  /**
   * 讀PDF文件,使用了pdfbox開源項目
   * @param fileName
   */
  public void readPDF(String fileName) {
   File file = new File(fileName);
   FileInputStream in = null;
   try {
  in = new FileInputStream(fileName);
   //新建一個PDF解析器對象
    PDFParser parser = new PDFParser(in);
    //對PDF文件進行解析
    parser.parse();
  //獲取解析后得到的PDF文檔對象
  PDDocument pdfdocument = parser.getPDDocument();
    //新建一個PDF文本剝離器
  PDFTextStripper stripper = new PDFTextStripper();
  //從PDF文檔對象中剝離文本
    String result = stripper.getText(pdfdocument);
    System.out.println("PDF文件" + file.getAbsolutePath() + "的文本內容如下:");
    System.out.println(result);
   } catch (Exception e) {
  System.out.println("讀取PDF文件"+ file.getAbsolutePath() + "生失敗!" + e);
    e.printStackTrace();
   } finally {
    if (in != null){
     try {
      in.close();
     } catch (IOException e1) {
     }
    }
   }
  }

  public static void main(String[] args) {
   ReaderForPDF pdf = new ReaderForPDF();
    String fileName = "src/tempPDF.pdf";
    try {
   pdf.readPDF(fileName);
  } catch (Exception e) {
   e.printStackTrace();
  }
   }
}
 本文由用戶 openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!