2013-06-13 7 views
0

OCRing PDF 작업을하고 있는데 Word 또는 Google 문서 도구에서 PDF를 내보냈는지 확인하는 방법이 있는지 궁금합니다. PDF가 Xpdf의 pdffonts로 OCR 된 것인지 확인할 수 있습니다. Word 및 Google 문서 도구가 내 보낸 PDF를 자동으로 OCR한다는 사실을 알고 있으므로 PDF가 OCR 된 적이 없다면 나는 그것이 수출되지 않았다는 것을 안다. 그러나 OCR 된 적이 있다면 PDF가 Word/Google 문서 VS에서 단순히 Tesseract와 같은 프로그램을 통해 OCRd로 내보내 졌는지 확인할 수있는 방법이 있습니까? 특히 저는 JavaScript로 작업하고 있지만 어떤 정보라도 유용합니다.PDF가 Word/Google 문서 도구에서 내보내 졌는지 확인하십시오.

답변

0

이 기사를 보는 사람들은 PDF 파일에 XMP 메타 데이터가 있는지 확인하기 위해 -meta 플래그와 함께 pdfinfo (Xpdf에서)를 사용하고 있습니다. Word 및 Google 문서 도구에서 내 보낸 PDF에는이 메타 데이터가 없지만 다른 PDF에는 없습니다.