2017-05-04 5 views
0

.txt 파일을 열고 단어를 목록의 별도 문자열로 분리하고 싶습니다 (예 : [this ','is ','an ','example ']). 이것을 시도 할 때 어떤 이유로 문자가 분리되어 원래 텍스트 문서에없는 이상한 기호와 문자가 시작 부분에 나타납니다. 목록으로 만들 파이썬 .txt 콘텐츠

file = open(userFile, "r") 
userInput = file.read() 
file.close() 
print(userInput) 

Screen shot of what I get when I run my code.

내 .txt 인 파일

만 단어 '뭔가 다른'반복 몇 번이 포함되어 있습니다.

+0

파일이 UTF-16으로 저장된 것처럼 보입니다. 사용하는 편집기는 UTF-8 또는 일반 ASCII 텍스트를 사용하도록 구성 될 수 있습니다. – jasonharper

답변

1
with open("input.txt", "r") as infile: 
    lines = infile.readlines() 
infile.close() 
words = [word.strip() for word in lines] 

이 기능은 다양한 파일 인코딩에 사용할 수 있습니다.

+0

ASCII도 작동해야합니다. –

+0

@ArtemisFowl 이것은 1 년 전 나 지식 하하 내가 그것을 업데이 트했습니다 – quantik