2014-04-28 64 views
1

을 사용하여 텍스트를 강조 표시 (강조 표시) pdf 내용을 텍스트로 변환하는 C# winform 응용 프로그램을 개발 중입니다. pdf의 강조된 텍스트에서 발견 된 내용을 제외하고 필요한 모든 내용이 추출됩니다. pdf에있는 강조 표시된 텍스트의 샘플을 추출하는 데 도움을주십시오. 프로젝트에서 iTextSharp.dll을 사용하고 있습니다.iTextSharp PDF C#

+1

주석에 대해 이야기하고 있습니까? 당신은 더 분명해야합니다. 주석은 페이지의 콘텐츠 스트림에 속하지 않는 요소입니다. 항상 페이지 상단에 추가되며 자체 모양 스트림이 있습니다. Adobe Reader에서 별도의 패널에 표시 할 수 있습니다. 우리는 그런 종류의 내용에 대해 이야기하고 있습니까? –

답변

1

의견을 말하고있는 것으로 가정합니다. 이것을 시험해보십시오 :

for (int i = pageFrom; i <= pageTo; i++) { 
    PdfDictionary page = reader.GetPageN(i); 
    PdfArray annots = page.GetAsArray(iTextSharp.text.pdf.PdfName.ANNOTS); 
    if (annots!=null) 
     foreach (PdfObject annot in annots.ArrayList) { 
      PdfDictionary annotation = (PdfDictionary)PdfReader.GetPdfObject(annot); 
      PdfString contents = annotation.GetAsString(PdfName.CONTENTS); 
      // now use the String value of contents 
     } 
    } 
} 

이것은 메모리에서 작성되었습니다 (저는 자바 개발자이며 C# 개발자가 아닙니다).