itext讀取PDF
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import org.pdfbox.pdfparser.PDFParser;
import org.pdfbox.pdmodel.PDDocument;
import org.pdfbox.util.PDFTextStripper;
/**
*
* @author 劉毅
* @date 2010-2-24
* @ClassName ReaderForPDF.java
* @Email liu_yi126@163.com
* @param 讀取PDF
* @param
*/
public class ReaderForPDF {
/**
* 讀PDF文件,使用了pdfbox開源項目
* @param fileName
*/
public void readPDF(String fileName) {
File file = new File(fileName);
FileInputStream in = null;
try {
in = new FileInputStream(fileName);
//新建一個PDF解析器對象
PDFParser parser = new PDFParser(in);
//對PDF文件進行解析
parser.parse();
//獲取解析后得到的PDF文檔對象
PDDocument pdfdocument = parser.getPDDocument();
//新建一個PDF文本剝離器
PDFTextStripper stripper = new PDFTextStripper();
//從PDF文檔對象中剝離文本
String result = stripper.getText(pdfdocument);
System.out.println("PDF文件" + file.getAbsolutePath() + "的文本內容如下:");
System.out.println(result);
} catch (Exception e) {
System.out.println("讀取PDF文件"+ file.getAbsolutePath() + "生失敗!" + e);
e.printStackTrace();
} finally {
if (in != null){
try {
in.close();
} catch (IOException e1) {
}
}
}
}
public static void main(String[] args) {
ReaderForPDF pdf = new ReaderForPDF();
String fileName = "src/tempPDF.pdf";
try {
pdf.readPDF(fileName);
} catch (Exception e) {
e.printStackTrace();
}
}
} 本文由用戶 openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!