pdf 파일을 구문 분석해야하는 안드로이드 애플리케이션을 개발 중입니다. 일부 pdf 파일에는 이미지 (이미지 포함 텍스트)가 포함되어 있습니다. 이미지 내의 텍스트를 파싱하고 싶습니다. iText 라이브러리 사용 방법안드로이드에서 itext를 사용하여 PDF에 포함 된 이미지 내에서 텍스트 추출
-1
A
답변
2
iText를 사용하면 pdf 문서에서 이미지를 추출 할 수 있습니다. 그러나 iText는 OCR (광학 문자 인식)을하지 않습니다. 나중에 이미지에서 텍스트를 추출하는 것은 당신에게 달려 있습니다.
볼륨 및 특정 유즈 케이스에 따라 Google 클라우드 API를 사용하는 것이 좋습니다. 이미지의 텍스트 인식을 처리하는 솔루션을 제공합니다.
Google 개발자 콘솔에서 다음과 같이 말합니다. "이미지 라벨링, 얼굴, 로고 및 경계표 감지, OCR (광학 문자 인식) 및 명시 적 콘텐츠 감지와 같은 Google Vision 기능을 응용 프로그램에 통합합니다."
자세한 내용은 https://console.developers.google.com을 참조하십시오.
친절한 답변, 요리스