2013-05-05 7 views
0

NLTK senseval 모듈에서, 감각은 HARD1, HARD2 등의 형태입니다 (소스 here 참조). 그러나 실제 정의를 얻는 방법이없는 것처럼 보입니다. 내가 Lesk 알고리즘을 구현하려고 해요, 그리고 지금은 레크 알고리즘에 의해 예측 감각이 올바른지 (WordNet에서 정의를 사용하여) 확인하려고 시도하고 있어요.NLTK의 senseval 모듈에서 의미에 대한 정의를 얻으려면 어떻게해야합니까?

나는 WordNet 정의를 senseval 대답 (HARD1, HARD2)과 통합하는 방법을 고민 중입니다. 누구나 정의에 대한 센스 발란스의 의미를 어떻게 해석 할 것인지, 아니면 어딘가에서 찾아 보는가?

답변

0

나는 이것들이 꽤 오래된 (Mac OS X 또는 Ubuntu 11.04에서 쉽게 설치할 수있는 것 같지 않은) WordNet 1.7의 감각에 해당한다는 것을 알게되었습니다.

찾을 수있는 온라인 버전의 WordNet 1.7이 없습니다.

이 사이트에는이 세 가지 코퍼스에 대한 유용한 정보가 있습니다. 예를 들어, 그것은 interest의 여섯 가지 감각이 Longman English Dictionary Online (2001 년경)에서 인용되었다고 말합니다. here

WordNet 1.7과 같이 HARD 원본을 설명합니다.

궁극적으로 필자는 수동으로 정의를 WordNet 3.0에 매핑했습니다. 관심이 있다면 여기에 사전이 있습니다. 그러나 나는 언어학의 전문가가 아니며 정확하지 않다는 것을 유의하십시오.

# A map of SENSEVAL senses to WordNet 3.0 senses. 
# SENSEVAL-2 uses WordNet 1.7, which is no longer installable on most modern 
# machines and is not the version that the NLTK comes with. 
# As a consequence, we have to manually map the following 
# senses to their equivalent(s). 
SV_SENSE_MAP = { 
    "HARD1": ["difficult.a.01"], # not easy, requiring great physical or mental 
    "HARD2": ["hard.a.02",   # dispassionate 
       "difficult.a.01"], 
    "HARD3": ["hard.a.03"],   # resisting weight or pressure 
    "interest_1": ["interest.n.01"], # readiness to give attention 
    "interest_2": ["interest.n.03"], # quality of causing attention to be given to 
    "interest_3": ["pastime.n.01"], # activity, etc. that one gives attention to 
    "interest_4": ["sake.n.01"],  # advantage, advancement or favor 
    "interest_5": ["interest.n.05"], # a share in a company or business 
    "interest_6": ["interest.n.04"], # money paid for the use of money 
    "cord": ["line.n.18"],   # something (as a cord or rope) that is long and thin and flexible 
    "formation": ["line.n.01","line.n.03"], # a formation of people or things one beside another 
    "text": ["line.n.05"],     # text consisting of a row of words written across a page or computer screen 
    "phone": ["telephone_line.n.02"], # a telephone connection 
    "product": ["line.n.22"],  # a particular kind of product or merchandise 
    "division": ["line.n.29"],  # a conceptual separation or distinction 
    "SERVE12": ["serve.v.02"],  # do duty or hold offices; serve in a specific function 
    "SERVE10": ["serve.v.06"], # provide (usually but not necessarily food) 
    "SERVE2": ["serve.v.01"],  # serve a purpose, role, or function 
    "SERVE6": ["service.v.01"]  # be used by; as of a utility 
}