2009-11-08 4 views
17

누구나 C/C++/Objective-C의 무료/오픈 소스 텍스트 인식 라이브러리를 알고 있습니까? 기본적으로 이미지를 스캔하고 일반 텍스트를 모두 읽을 수있는 무언가.C/C++/Objective-C 텍스트 인식 라이브러리

+4

이 기사를 이미 본 적이 있는지 궁금한 점이 있지만 궁금하신 점이 있으시면 http://sudokugrab.blogspot.com/2009/07/how-does-it-all -work.html – refulgentis

+1

링크를 제공해 주셔서 감사합니다. 답변을 작성해야합니다. –

답변

12

가장 유명한 제품은 Motorola에서 처음 개발 한 Tesseract OCR이며 나중에 오픈 소스가되었습니다. 그것은 또한 Google에 의해 승진된다.

은 몇 가지 더, 아마하지 유명한 정팔 포체로가 있습니다 http://en.wikipedia.org/wiki/OCRopus http://jocr.sourceforge.net/

+1

점프 후 HP는 소스 코드로 HP를 언급합니다 ... – stefanB

+1

Tesseract는 매우 좋지만 제한 사항은 조심하십시오. 비 라틴 문자 스크립트 (즉, 중국어)를 다루는 데 있습니다. – Jonathan

+0

몇 가지 샘플로 tesseract를 시도했지만 전체 단락에서 몇 자의 글자를 인식하고 나머지는 junk symbols입니다. 영어로 된 전체 단어를 메모장에 입력하고 캡쳐 한 경우에도 –

2

Here이 그림에서 번호를 추출하는 방법에 대한 흥미로운 기사입니다.

작가는 neural networks algorithm을 훈련시키기 위해 많은 수의 샘플을 수집하며 나는 OpenCV으로 이미지 처리를한다고 믿는다.

2

오픈 소스 OCR 라이브러리 : 1. ABBYY 모바일 OCR 엔진 모바일 및 소형 풋 프린트 애플리케이션 개발자는 매우 정확한 광학 문자 인식 (OCR)로 이미지와 사진을 변환 기술을 통합 할 수있는 강력한 소프트웨어 개발 키트입니다 관리하기 쉽고 검색 가능한 텍스트 툴킷은 iOS (iPhone) 및 Android와 같이 가장 널리 사용되는 모바일 플랫폼 및 장치를 지원합니다. http://www.abbyy.com/mobileocr/

2.Tesseract는 아마도 가장 정확한 오픈 소스 OCR 엔진 일 수 있습니다. https://code.google.com/p/tesseract-ocr/

+0

왜이 코드가 다운 되었습니까? – Mathai

+0

나는 유권자가 아니지만 Sumit이 그들과 관련되었다는 최초의 면책 조항없이 ABBY Mobile 광고를 많이 읽었습니다. 나는 이것이 상황이라고 생각하지 않지만, 나는 결과로서 투표하는 기쁜 행복한 독자를 볼 수 있었다. – RyanfaeScotland