2017-01-02 12 views
1

나는 Tess-two를 OCR 문서에 사용하고 있습니다. Tesseract 팀이 훌륭한 업무를 수행 한 것으로 보이며 그 결과가 대단히 좋습니다 !!
하지만 이제는 내 user_data 파일의 단어 만 사용하고 싶습니다.
여기서 https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#config-files-and-augmenting-with-user-data은 아주 좋은 예입니다. Tesseract의 링크가 제안하는 내 안드로이드 프로젝트의 모든 파일을 찾았지만 user_data 파일의 단어를 프로그램에서 사용할 수 없습니다. configs 폴더에서 .bazaar 파일을 찾았지만 코드에서 어떻게 설정합니까 ??
내가 놓친 것이 있습니까?ANDROID의 사용자 데이터를 사용하여 테스 트의 OCR 출력을 늘리는 방법은 무엇입니까?

다음은 tessbaseApi를 초기화하고 명령을 설정하는 코드의 일부입니다.

TessBaseAPI baseApi = new TessBaseAPI(); 
    baseApi.setDebug(true); 

    baseApi.init(Environment.getExternalStorageDirectory() + "/EMB/dataBase/", "eng"); 

    baseApi.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED); 
    baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD); 
    baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE); 


    baseApi.ReadConfigFile("/path/to/configs/bazaar");  

    baseApi.setImage(myBitmap); 
    //variable for recognizing 

    String recognizedText = baseApi.getUTF8Text(); 
    /*recognizedText = recognizedText.replaceAll(blackList, "");//remove space*/ 
    String resultTxt = recognizedText; 
    // 
    baseApi.end(); 
    ocrreadytext.setText(resultTxt); 

미리 감사드립니다.

+0

baseApi.ReadConfigFile (Environment.getExternalStorageDirectory() + "/ EMB/dataBase/tessdata /"+ "bazaar.txt")를 사용했습니다. 이제 앱은 설정 파일을 보지만 아무 일도 일어나지 않습니다. 바자 파일에서 알 수없는 명령을 설정하면 앱이 다운됩니다 ... 한 번에 한 단계 씩 – Farmaker

답변