0
5KB
이하의 텍스트 및 pdf 파일을 다루고 있습니다. 파일이 텍스트 파일 인 경우, 나는 형태에서 파일을 얻을 문자열에서 필요한 입력 요약 얻을 :Python/Django에서 한 줄씩 pdf 파일을 읽는 방법은 무엇입니까?
file = file.readlines()
file = ''.join(file)
result = summarize(file, num_sentences)
하지만 PDF의 그것이 그렇게 쉬운 일이 아니다 밝혀 파일. Python/Django에서 txt 파일을 작성한 것처럼 pdf 파일의 문장을 문자열로 가져 오는 방법이 있습니까?
이것은 가능한이 질문의 중복입니다 : http://stackoverflow.com/questions/2481945/how-to-read-line-by-line- in-pdf-file-using-pypdf – halflings
예, 아마도. 그러나 나는 이미 그 문제에서 제안한 해결책을 시도했다. 문자열에있는 모든 파일의 내용을 반환 할 수 없습니다. – pynovice
어쩌면 당신은 당신의 질문에 그것을 말할 수 있고 정확히 무엇이 잘못되었는지 (오류 메시지? 틀린 내용?) 우리가 당신을 도울 수 있다고 말 할 수 있습니다! – halflings