2014-04-30 6 views
-2

몇 가지 알려진 형식의 문서를 사진/스캔했습니다. 모든 문서에는 알려진 속성 (날짜/시간, 이름 및 항목 목록)이 있습니다.OCR 몇 가지 알려진 양식 형식. 어디서 시작하나요?

어떤 app/libs (Objective) C/C++로 시작 하시겠습니까? OpenCV가 그렇게 할 수 있습니까? OCR은 어떻습니까? OCR을위한 레이아웃 인식?

감사합니다.

P. 내 글을 다시 쓰는 방법을 제안하십시오.

P.P.S. 나는 유망한 도구 (iOS 용 예제 포함)를 찾았습니다. https://code.google.com/p/tesseract-ocr/https://github.com/robmathews/OCR-iOS-Example

+0

왜 개선 투표에 도움이 되었습니까? ( – xvga

답변

1

텍스트가 페이지에있는 곳을 감지하려면 OpenCV를 사용하여 텍스트 영역을 tesseract로 보내도록 권장합니다.

찾기 텍스트 :

침식 이미지

이 윤곽

찾기 윤곽

그 경계 상자는 텍스트 또는 로고/사진을 포함해야의 경계 박스를 가져옵니다.

+0

감사합니다. Nick! – xvga

+0

아주 작은 것 또는 매우 큰 것 같은 특정 상자를 거부하는 기준을 사용할 수도 있습니다. 윤곽의 영역. – Clip