PDF 파일에서 텍스트를 추출 중입니다. 이 코드는 다음과 같습니다.php에서 pdf의 텍스트 추출이 모든 PDF 파일에서 작동하지 않습니다.
<?php
require("PdfToText.php");
$file = 'SamplePF' ;
$pdf = new PdfToText ("$file.pdf") ;
echo ($pdf -> Text) ;
?>
이 클래스는 일부 PDF 파일에서 잘 작동합니다. 이 클래스의 문제이다 : 그것은 현명하지 페이지 순서로 임의 페이지/라인의 텍스트를 가지고 일부 PDF 파일
- .
- 일부 PDF 파일의 경우 결과가 표시되지 않습니다.
- 일부 PDF 파일의 경우 한두 줄만 추출합니다.
몇 가지 해결책을 제안하십시오. 고맙습니다!
일부 PDF 파일은 이전 버전이며 더 이상 동일한 구조를 사용하지 않습니다. 문제가있는 경우 Adobe에게 왜 공개 API를 게시하지 않았는지 문의하십시오. – Xorifelse