2017-12-28 9 views
1

좋아요, 그래서 여기에 내가하려고하는 것이 있습니다. 텍스트 파일의 텍스트를 워드 문서로 쉽게 변환하고 싶습니다. 나는 현재 이것을 가지고 있습니다 ...목록의 단어에 공백을 쉽게 추가 할 수 있습니까?

텍스트 파일의 텍스트를 읽은 다음 각 단어가 목록에 추가됩니다. 그런 다음 모든 단어가 Document에 추가되지만 문제는 모두 함께 실행되는 단어이며 공백이 없습니다. 다음은

GetreadytoentertheThrivetimeshowontalk.Radio1170broadcastinglivefromthecenteroftheuniverse.It'SbusinessschoolwithouttheBSfeaturingoptometristturnedentrepreneur.Dr.RobertzoellnerwithusSBA,entrepreneuroftheYearclayClark.Dowehavecominginfromoneofourlistenersthattheyasked?Howcanyoucontrolemployeesthatyoucannotfire?HowcanyoucontrolemployeesthatyoucannotfirewellSteve?Couldyouthrowoutsomeinstanceswherethatcouldbeathingwhereyoucouldn'tfiretosuchasuper? 

그래서 내가 알고 싶은 것은이이 작업을 수행하는 가장 좋은 방법입니다 ... 텍스트 같은 모습의 예입니다? 더 간단한 방법이 있습니까? 어떤 도움이라도 대단히 감사 할 것입니다. 미리 감사드립니다 !!! 당신은 다음과 같은 일하기 위해 추가 단락 부분을 수정해야하므로

+0

구분 기호가 없거나 문장에 어떤 단어가 있는지를 쉽게 알 수 있기 때문에 쉽게 해결할 수 없습니다. 단어를 만들려면 공백을 어디에 두어야할지 모를 것입니다. – arkdevelopment

+3

제대로 이해하면 원본 텍스트 파일에 공백이있어 프로그램에서 해당 텍스트 파일을 제거하고 있습니다. 어떤 질문을합니다 ... 왜? 어쨌든 전체 파일을 원한다면 왜 공백을 나누고 있습니까? –

+0

@SilvioMayolo 좋은 지적. 다른 프로젝트의 코드 블록 이었기 때문에 목록에있는 단어를 가져 오는 것이 가장 좋은 방법이었습니다. 대신에 무엇을 사용 하시겠습니까? – EliC

답변

5

왜 단어를 몇 줄로 나눴나요? 모든 것을 복사하려면 분할하는 대신 줄과 함께 (공백과 줄 바꿈을 복사합니다) 이동해야합니다. 코드가 다음과 같이 표시됩니다.

from docx import Document 

text_file = "pathToYourTextFile.txt" 

#opens document to add text to 
document = Document() 

#adds the entire contents to a list that we will 
#then use to add to the document we just created 
fileContents = [] 
for line in open(text_file): 
    fileContents += line 

#adds all the text we just created to the document as a paragraph 
paragraph = document.add_paragraph(fileContents) 

#saves the document with all the under the name we give it 
document.save('test.docx') 
print("Document saved.") 

좋은 댓글 btw!

해피 코딩!

2

당신은 " ".join(fileContents)을 사용할 수 있습니다 : 당신이 공간에 분할하는 이유

fileContents = [] 
for line in open(text_file): 
    row = line.split(' ') 
    fileContents += list(row) 

#adds all the text we just created to the document as a paragraph 
paragraph = document.add_paragraph(" ".join(fileContents)) 
2

그것은 전혀 분명하지 않다. row = line.split(' ')을 제거하고 후속 라인 fileContents += line을 만들면 원하는 것을 얻으실 수 있습니까? 이전 줄을 fileContents += '\n' 다음에 따라 뉴 라인을 복원 할 수도 있습니다.