2016-08-18 7 views
-3

나는형식의 CV를 가지고 있으며 키워드 NLP (자연 언어 처리)를 추출하고 싶습니다. 여기에 첨부 된 이미지가 있습니다.어떻게하면 pdf 파일 asp.net C#에서 키워드를 추출 할 수 있습니까?

하지만 난 내가 감사 imgimg2

+0

http://asp.syncfusion.com/demos/reporting/pdf/import%20and%20export/TextExtraction/CS/Default.aspx response.Let에 대한 –

+0

감사 나에게 답장을 –

+0

감사하십시오 확인하지만 어떻게 내가 asp.net C# –

답변

0

오픈 소스 라이브러리 iTextSharp라는이 나에게 도움을 주시기 바랍니다 초보자 해요, 그것을하는 방법을 모르겠어요.

CV를 업로드하여 특정 경로의 서버에 배치하면 문자열로 된 내용을 읽을 수 있으며 아래 텍스트와 같이 텍스트가 있는지 확인할 수 있습니다.

public bool KeywordExists(string keyWord) 
{ 
    using (PdfReader reader = new PdfReader(pdfPath)) 
    { 
     StringBuilder strText = new StringBuilder();  
     for (int i = 1; i <= reader.NumberOfPages; i++) 
     { 
      strText.Append(PdfTextExtractor.GetTextFromPage(reader, i)); 
      if(strText.Contains(keyWord)) return true; 
     } 
     return false; 
    } 
} 
+1

목표가 keyWord의 존재를 단순히 확인하는 경우, Contains가 즉시 실행되지 않는 이유는 무엇입니까? 모든 페이지에서? 그런 식으로 초기 페이지에 keyWord가있는 경우 나중에 페이지에서 추출하지 않고 즉시 반환 할 수 있습니다. – Martheen

+0

@Martheen이 의견을 보내 주셔서 감사 드리며 변경했습니다. – Imad

+0

확인해주세요. –