2016-12-16 9 views
0

블로그의 설명을 긁어 감정을 정하고 정보를 제공하려고합니다.문자열이 어떤 텍스트 파일에 속하는지 확인하려고합니다.

자주 사용되는 명사 (상위 10 개)를 발견했습니다.

그 과정이 끝나고 나는 두 개의 txt 파일을 만들었습니다.

첫 번째 파일에는 감정적 인 명사가 포함되어 있습니다. 두 번째 파일에는 정보 용 명사가 들어 있습니다.

마지막으로, 블로그에 더 많은 정서적 명사가 있는지 또는 더 많은 정보 용 명사가 있는지 알고 싶습니다. 마지막 과정에서 어떤 코드를 작성해야합니까?

+0

파일이 얼마입니까? 파일이 작아서 쉽게 처리 할 수 ​​있다면 사전으로 두 개의 파일을 가져 와서 파이썬에서 카운터를 사용하여 루프를 작성하면됩니다. 사전의 단어가 있으면 카운터가 증가합니다. 어떤 카운터가 더 높았습니까, 블로그에 들어있는 게 더 많습니까 –

+0

대략적인 코드를 보여 주시겠습니까? 제발 ..TT – zzzwww

+0

** 당신은 ** 아직 아무 것도 시도하지 않았습니까 ** 아직? 그래서 무료 코딩 서비스가 아닙니다. –

답변

0
# This is the file where you have your top 10 nouns 
fc = open("words.txt") 
list_blog = [] 
for line in fc: 
    list_blog.append(line.strip()) 

f1 = open("file1.txt") # This is your first file of emotional nouns 
d1 = {} 
c = 0 
for line in fc: 
    c+=1 
    d1[line] = str(c) 

f2 = open("file2.txt") # This is your seconf file of informational nouns 
d2 = {} 
c = 0 
for line in fc: 
    c+=1 
    d2[line] = str(c) 

count1 = 0 
count2 = 0 
count3 = 0 

for i in list_blog: 
    if i in d1: 
     count1+=1 
    elif i in d2: 
     count2+=1 
    else: 
     count3+=1 

print(count1,count2,count3) 

그것을 쓸 수있는 더 좋은 방법이있을 수 있지만, 난 그냥 빨리 쓴이 아니 가장 효율적인 코드 그래서