2017-04-30 5 views
1

텍스트와 이미지가 포함 된 문서에서 빈 줄을 제거하려면 Python docx을 사용하고 있습니다. paragraph.clear()paragraph.run.clear()을 사용하면 점에 영향을 미치지 만 출력 된 파일에는 여전히 Word에 표시된 단락 기호 만있는 빈 줄이 있습니다. 단락 기호를 직접 검색하는 방법이 있습니까? 아니면 선을 지우는 더 좋은 방법이 있습니까?Python Docx를 사용하여 빈 줄 제거

# code snippet 
for paragraphs in document.paragraphs: 
    if paragraphs.text == "\n": 
     paragraphs.clear() 

답변

1

빈 줄은 "\ n"이 아니라 빈 문자열 ""로 표시됩니다.

덧붙여 clear()은 단락 자체는 제외하고 텍스트를 제거합니다.

각 단락마다 len(paragraph.text)==0을 테스트 해보십시오.

+0

'len (paragraph.text.strip()) == 0'은 공백 만 포함하는 단락을 감지하기 때문에 한 단계 더 철저합니다. – scanny

+0

'len (paragraph.text.strip()) == 0 '을 사용하면 안타깝게도'clear()','len (paragraph.text) == 0'과 함께 이미지를 제거합니다. 단락 자체를 제거하려면 무엇을 사용해야합니까? – Tom