Java OCR(使用Tess4J)

jopen 9年前發布 | 39K 次閱讀 Tess4J Java開發

 最近突然對手機上的OCR功能比較感興趣,于是乎研究了一下Java OCR技術,在Google上找到了tesseract-ocr,最后找到了其對應的Java API版本 Tess4J,中間調試過程異常曲折,最后花了半天時間終于把它給調試成功了,跟大家分享一下!

一 下載相關的jar包

1.下載Tess4J jar,網址:http://sourceforge.net/projects/tess4j/

2. 如果你使用的JVM 64位的,還需要下載 liblept168.dll、libtesseract302.dll的64位文件,下載地 址:https://github.com/charlesw/tesseract/tree/master/src/lib/TesseractOcr /x64


二 項目整合

先看看最后整合成功的目錄結構,開發環境:Win8.1 64位 + Eclipse 4.2 + JDK 7 64位,工程目錄結構如下:

Java OCR(使用Tess4J)


       src目錄下是 Tess4J的源碼目錄,test目錄 是Tess4J官方提供的demo目錄,并將 liblept168.dll、libtesseract302.dll,gsdll64.dll(pdf 轉換需要用到此文件) 三個文件拷貝到 src根目錄下。


三 測試代碼

    /**

     * Test of doOCR method, of class Tesseract1. 
     */  
    @Test  
    public void testDoOCR_File() throws Exception {  
        System.out.println("doOCR on a PNG image");  
        File imageFile = new File("eurotext.png");  
        String expResult = "The (quick) [brown] {fox} jumps!\nOver the $43,456.78 <lazy> #90 dog";  
        String result = instance.doOCR(imageFile);  
        System.out.println(result);  
        assertEquals(expResult, result.substring(0, expResult.length()));  
    }  </pre><br />

原文地址: http://blog.csdn.net/top_code/article/details/39667299

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!