기준 태그 지정자에 대한 코드를 작성하고 있습니다. Brown corpus를 기반으로 가장 일반적인 태그를 단어에 할당합니다. 따라서 단어 "작품"이 동사로 23 번, 복수형 명사로 30 번 태그가 붙은 경우 사용자 입력 문장의 단어에 따라 복수형으로 태그가 지정됩니다. 단어가 코퍼스에서 발견되지 않으면 기본적으로 명사로 태그가 지정됩니다. 내가 지금까지 가지고있는 코드는 가장 빈번하지 않은 단어에 대한 모든 태그를 반환합니다. 단어 당 빈번한 태그 만 반환하는 방법은 무엇입니까?Python과 NLTK :베이스 라인 태그 지정자
import nltk
from nltk.corpus import brown
def findtags(userinput, tagged_text):
uinput = userinput.split()
fdist = nltk.FreqDist(tagged_text)
result = []
for item in fdist.items():
for u in uinput:
if u==item[0][0]:
t = (u,item[0][1])
result.append(t)
continue
t = (u, "NN")
result.append(t)
return result
def main():
tags = findtags("the quick brown fox", brown.tagged_words())
print tags
if __name__ == '__main__':
main()
와하하, 귀하의 모든 nltk 질문에 답변하면 곧 지불을 요청할 것입니다. lolz, 그냥 농담을하고 나에게 타입 분을 준다. – alvas
미안하지만 점심 먹으러갔습니다. 아래에 'most_frequent_pos_tagger()'가 필요합니다. – alvas