2010-12-28 4 views
1

"to", "and"와 같은 단순한 일반 문구와 "pick up", "fall in love", " 붉은 청어 ","막 다른 골목 "?NLP 기술을 사용하여 숙어를 가려내고 다른 일반적인 문구와 구별을 설정하는 방법은 무엇입니까?

HMM은 사전 없이도 성공할 수있는 기법이 있습니까? 예를 들어 HMM은 대규모 코로나를 훈련합니까?

또는 혼자서 또는 한정된 관용어 구에서 나오는 단어 대 거의 모든 단어와 함께 발생할 수있는 "난잡한"단어를 무시하거나 가중하는 것과 같은 경험적 방법이 있습니까?

그러한 추론이 있다면, "두들겨 패다", "먹다", "앉다", "생각하다"와 같은 혼란스런 단어를 포함하는 어구와 구어를 어떻게 고려해야합니까? "? Unsupervised Type and Token Identification of Idiomatic Expressions

답변

2

당신이 낱말의 배치 검출 찾고 :

UPDATE는

나는 재미있는 종이 온라인을 발견했습니다?

우수한 책, 매닝으로 자연 언어 처리의 기초 Schütze에서 this 장을 살펴보십시오.

+0

잘 배열은 숙어보다 넓은 필드이지만 일반적인 구문보다 좁습니다. 링크 덕분입니다. – hippietrail