2013-01-07 4 views
2

현재 PorterStemmer를 사용하여 파생 단어를 식별하고 있습니다. 그러나, 나는 같은 의미가 아니지만 가지고있는 단어로 문제에 직면하고있어. 예를 들어
MarketMarketing
WineWinning

는 다른 의미를 가지고 있지만 PorterStemmer 동일한로를 식별한다.인기있는 단어를 다른 의미로 일치시키지 않는 줄무늬 표시

어떤 열린 도구가 이러한 문제를 해결할 수 있습니까? 코너 - 케이스가있는 사전? 고급 스템 머?

PHP를 통해 쉽게 액세스 할 수있는 무언가가 바람직합니다.

+0

PHP로 뭔가를 찾았습니까? –

+0

죄송합니다, 아직 아무것도 찾지 못했습니다. 그럴 경우 저를 업데이트하십시오. – Noam

답변

3

스테미 머가 언어의 지식없이 소리 나는대로 작동하기 때문에 형태소 분석기와 관련된 알려진 문제입니다. 구제기를 필요로합니다. 나는 주로 Java-based Stanford CoreNLP을 사용하지만, PHP에 뭔가 있어야한다고 확신합니다.