itext讀取PDF
import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.pdfbox.pdfparser.PDFParser; import org.pdfbox.pdmodel.PDDocument; import org.pdfbox.util.PDFTextStripper; /** * * @author 劉毅 * @date 2010-2-24 * @ClassName ReaderForPDF.java * @Email liu_yi126@163.com * @param 讀取PDF * @param */ public class ReaderForPDF { /** * 讀PDF文件,使用了pdfbox開源項目 * @param fileName */ public void readPDF(String fileName) { File file = new File(fileName); FileInputStream in = null; try { in = new FileInputStream(fileName); //新建一個PDF解析器對象 PDFParser parser = new PDFParser(in); //對PDF文件進行解析 parser.parse(); //獲取解析后得到的PDF文檔對象 PDDocument pdfdocument = parser.getPDDocument(); //新建一個PDF文本剝離器 PDFTextStripper stripper = new PDFTextStripper(); //從PDF文檔對象中剝離文本 String result = stripper.getText(pdfdocument); System.out.println("PDF文件" + file.getAbsolutePath() + "的文本內容如下:"); System.out.println(result); } catch (Exception e) { System.out.println("讀取PDF文件"+ file.getAbsolutePath() + "生失敗!" + e); e.printStackTrace(); } finally { if (in != null){ try { in.close(); } catch (IOException e1) { } } } } public static void main(String[] args) { ReaderForPDF pdf = new ReaderForPDF(); String fileName = "src/tempPDF.pdf"; try { pdf.readPDF(fileName); } catch (Exception e) { e.printStackTrace(); } } }
本文由用戶 openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!