2017-01-09 5 views
0

PDF 파서 (http://www.pdfparser.org/)가 설치되었습니다. 나는 그들의 웹 사이트를 확인하고 데모를 사용했다. 이것은 나에게 내가 원하는 결과를 주었다. 작곡가를 사용하는 방법을 검색 한 후 마침내 그 파일을 사용할 수있었습니다. 이제 데모에서 결과를 얻는 방법에 대한 다음 문제로 인해 어려움을 겪고 있습니다.'Smalot PDF Parser'결과 : 동일한 줄에 텍스트가 없습니다.

설명서 페이지의 예제 코드를 사용했습니다. 텍스트를 추출했지만 모든 텍스트가 같은 줄에 있습니다. 데모를 사용할 때 모든 새 페이지는 새 단락으로 시작하고 모든 텍스트는 분리 된 줄에 배치되었습니다. 코드 :

<?php 

// Include Composer autoloader if not already done. 
include 'vendor/autoload.php'; 

// Parse pdf file and build necessary objects. 
$parser = new \Smalot\PdfParser\Parser(); 
$pdf = $parser->parseFile('document.pdf'); 

// Retrieve all pages from the pdf file. 
$pages = $pdf->getPages(); 

// Loop over each page to extract text. 
foreach ($pages as $page) { 
    echo $page->getText(); 
} 

?> 

위의 코드를 사용했을 때 나는 한 줄에 모든 텍스트를 넣었습니다. 내 질문은 데모 페이지에서 스크립트와 동일한 결과를 얻으려면 어떻게해야합니까 ??

답변

0

나는 동일한 문제가있었습니다. nl2br로이 방법으로 반복하십시오.

// Loop over each page to extract text. 
foreach ($pages as $page) { 
echo nl2br($page->getText()); 
}