2014-06-07 7 views
1

우크라이나어 용 hunspell 형식 (.dic 및 .aff)의 파일이 2 개 있습니다. 내 프로그램은 입력 단어의 기본 형식을 가져와야합니다. 따라서 .dic 파일의 단어 형식과 .aff 파일의 affords를 사용할 수 있습니다. Hunspell 유틸리티로도이를 수행하는 방법을 모르지만 가능하다고 가정합니다.* .dic * .aff를 사용한 Python의 형태 텍스트 분석

. 파이썬 라이브러리는 .dic 및 .aff 파일을 사용하여 기본 형식을 얻을 수 있습니까?

+1

https://pypi.python.org/pypi/hunspell/0.2.1이 내 첫 번째 Google 조회수입니다. – tripleee

답변

2

hunspell은 귀하가 필요로하는 라이브러리입니다. https://code.google.com/p/pyhunspell/wiki/UsingPyHunspell에서 예 :

import hunspell 
hobj = hunspell.HunSpell('/usr/share/myspell/en_US.dic', '/usr/share/myspell/en_US.aff') 
hobj.spell('spookie') 
>>>>False 

hobj.suggest('spookie') 
>>>>['spookier', 'spookiness', 'spooky', 'spook', 'spoonbill'] 

hobj.spell('spooky') 
>>>>True 

hobj.analyze('linked') 
>>>>[' st:link fl:D'] 
hobj.stem('linked') 
>>>>['link'] 
+0

새 단어를 사전에 추가하는 방법을 알고 있습니까? pyhunspell의 C 소스에 add() 함수가 있지만 사용법과 인수에 대한 설명이 없습니다. –