2017-12-26 12 views
-1

PDF 내에서 지정된 두 좌표로 지정된 특정 사각형 영역에서 데이터를 추출하려고합니다. PDF에서이 작업을 수행 할 수 있습니까? 아니면 이미지로 변환하여 OCR을 사용해야합니까? 그렇다면 PDFBox 또는 iText에 OCR을 통해 이미지를 분석하는 방법이 포함되어 있습니까? 감사!Java를 사용하여 PDF의 특정 직사각형 영역에서 데이터를 추출하는 방법은 무엇입니까?

Bank Statement

+0

안녕하세요, 왜이 게시물에 투표하지 않는 이유는 모르겠습니다. 실수가 있다고 생각 되시면 알려 주시기 바랍니다. 향후 게시물을 개선 할 수 있습니다. 감사. – itsfaraaz

답변

0

지역이 텍스트 인 경우. pdfbox,

PDDocument document = PDDocument.load(new File("target.pdf")); 
PDFTextStripperByArea stripper = new PDFTextStripperByArea(); 
stripper.setSortByPosition(true); 
Rectangle rect = new Rectangle(35, 375, 340, 204); 
stripper.addRegion("class1", rect); 
stripper.extractRegions(document.getPage(1)); 
System.out.println(stripper.getTextForRegion("class1") 
+0

도움 주셔서 감사합니다. – itsfaraaz