2017-11-24 6 views
0

문장과 레이블이있는 파일 샘플이 있습니다. 어떻게 문장과 레이블로 나눌 수 있습니까?파이썬에서 문장과 레이블로 줄 바꿈하기

고민, 표류하는 청년에 대한 매우, 매우 느리게 움직이는 무 목적 영화. 0

누가 길을 잃었는지 잘 모르겠다 - 평평한 캐릭터 나 청중, 거의 절반이 걸어 나왔다. 0

흰색과 똑똑한 카메라 앵글을 가진 흑백을 시도하면서 영화는 실망 스러웠다. 연기는 가난했고 줄거리와 선은 거의 존재하지 않았기 때문에 실망했다. 0

음악이나 그 밖의 이야기는 거의 없습니다. 문장의 0

출력
목록 :
[ '매우, 매우, 매우 느리게 이동, 고민, 표류 젊은이에 대한 목적없는 영화'더 잃었다 있는지, '안 - 0 ','0 ']

+0

문장과 라벨로 나뉘어서 무엇을 의미하는지 자세히 설명해 주실 수 있습니까? 별도의 파일에 저장 하시겠습니까? 아마도 출력 형식의 예가 명확하게 나타납니다. – oldmonk

+0

모든 레이블 {0}을 별도로 저장하고 해당 텍스트 문장을 별도로 저장해야합니다. – avinash

+0

텍스트와 레이블을 별도의 목록으로 분리하는 답변을 추가했습니다. – oldmonk

답변

1

. 이 목록의 데이터를 사용자가 요청한대로 별도로 파일에 쓸 수 있습니다.

fmov=open('yourdata.txt','r') 
sentence_list=[] 
label_list=[] 
for f in fmov.readlines(): 
    lineinfo=f.split('.') 
    sentenceline=".".join(lineinfo[0:-1]) 
    sentence_list.append(sentenceline) 
    label_list.append(str(lineinfo[-1]).replace('\n','')) 
print(sentence_list) 
print(label_list) 

OUT: 
['A very, very, very slow-moving, aimless movie about a distressed, drifting young man', 'Not sure who was more lost - the flat characters or the audience, nearly half of whom walked out', 'Attempting artiness with black & white and clever camera angles, the movie disappointed - became even more ridiculous - as the acting was poor and the plot and lines almost non-existent', 'Very little music or anything to speak of'] 
[' 0', ' 0', ' 0', ' 0'] 
+0

코드에'flake8'을 실행하십시오. PEP8 (https://www.python.org/dev/peps/pep-0008/)은'sentence_list'와'label_list'와 같은 식별자를 사용하도록 요청합니다. –

+0

@J_H 감사합니다. 나는 flake8에 대해 몰랐습니다. 식별자 이름을 편집했습니다. – oldmonk

0

인가'0 '레이블 : 거의 절반이'
[]

해당 라벨 '걸어 나갔다 평면 문자 나 관객? 단 하나의 문장 일 경우 마침표를 구분 기호로 사용하여 string.split('.')을 사용할 수 있습니다. 비록 당신이 'Mr.'과 같은 문장을 가지고 있다면 이것은 약간의 실수를 범할 수도 있지만, 또는 '부인' 따라서 if 문을 처리하기 위해 if 문을 추가해야 할 수도 있습니다. 파일 'yourdata.txt'에 저장된 다음 코드 2 개에는 sentence_listlabel_list 생성시기 지난 후 "."(도트) 수는 주어진 예를 들어 라벨

이라고 가정