2017-11-14 8 views
1

Adobe Acrobat .pdf 파일 목록에 회전 텍스트 (0 도가 아닌 텍스트)가 포함되어 있는지 확인하는 방법이 있는지 아는 사람 있습니까?회전 된 텍스트가 포함 된 파일의 경우 Adobe Acrobat .pdf가 일괄 처리됩니다.

나는 이것이 간단 할 것이라고 생각했지만 답변을 찾으려고 애 쓰고 있습니다.

수천 개의 파일을 OCR 처리하기 위해 ABBYY Recognition Server를 사용하고 있으며 텍스트가 회전되는 곳에서는 결과가 매우 나쁩니다. 텍스트를 회전 시켜서 미리 처리 할 수있는 파일 목록을 가져와야합니다.

보통 저는 iTextSharp를 .pdf 자동화 및 수정에 사용하지만 텍스트 회전 확인을 위해 아무것도 찾을 수없는 것 같습니다.

감사

답변

0

당신이 PDF 파일에서 모든 단어를 추출 단어 중 하나가 회전하면 확인하여 목표를 달성 할 수있다.

작업에 대해 PDF 라이브러리의 고급 기능을 사용하는 것이 좋습니다. Docotic.Pdf library은 좋은 선택입니다 (물론, 저는 도서관 개발자 중 한 명입니다). 여기

등 자신의 위치

각 추출 된 단어가 PdfTextData 목적으로 제공에 대한 추가 정보와 extract words from PDFs하는 방법을 보여주는 예입니다. PdfTextData에는 단어가 회전, 크기 조정 및/또는 뒤집 혔는지 확인하는 속성 인 IsTransformed이 포함되어 있습니다. 변형에 대한 자세한 내용은 PdfTextData.TransformationMatrix을 분석 할 수도 있습니다.

+0

답장을 보내 주셔서 감사합니다. 나는 내 솔루션을 코딩의 '무료'방법을 기대했다. – GoodJuJu