2012-10-13 4 views
5

가중치가인 긍정적이고 부정적인 단어 목록이 얼마나 강하고 주인지에 따라 단어가 할당되어 있어야합니다. 나는 가지고있다 :감정 분석 - wordNet, sentiWordNet lexicon

1.) WordNet - 그것은 모든 단어에 대해 + 또는 - 점수를 준다.

2.) SentiWordNet - [0,1] 범위에서 양수 값과 음수 값을 제공합니다. 워드 넷 나는 내가 그것을 적어도 몇 가지 요인에 의해 양성해야한다고 생각하는 이유 몰라요, 명사와 동사 모두 0.0주고있다 -

나는

사랑은, 몇 마디에이를 확인했습니다.

repress - wordNet 제공 -9.93
- SentiWordNet은 pos와 neg 모두에 대해 - 0.0을 제공합니다. 워드 넷 - - 2.488
- SentiWordNet - {POS - 0.125, NEG - 0.5}

내가 사용하는 어느 하나를 결정 도움이 필요 (긍정적한다)

휴식 (음성이어야한다).

감사합니다.

+0

더 나은 결과를 제공하는 것. :-) – Reactormonk

+3

WordNet에서 어디에서 긍정적 인 부정적인 점수를 얻었습니까? – justhalf

답변

2

정도 및/또는 극성은 도메인 및/또는 컨텍스트에 따라 달라질 수 있으므로 단어만으로는 결정할 수 없습니다.

데이터에 주석이있는 경우 두 자원에서 제공하는 점수를 기능으로 사용하여 분류자를 교육하는 것이 좋습니다. 그렇지 않은 경우, 문제의 도메인과 일치하는 사용 가능한 정서 표식이 된 코퍼 중 하나를 사용하는 것이 좋습니다. 모든 데이터가 없으면 감정적 분류에 대한 감독되지 않은 접근법에 대한 실질적인 작업이 있지만, 전체 작업은 다소 까다로워집니다. 내가 Wordnet는 3.1 최신 다운로드 및 file format documentation을 확인 http://sentiwordnet.isti.cnr.it/search.php?q=repose

, 그리고 감정의 어떤 언급이 표시되지 않는 : 당신은 그들이 잘못 생각하는 경우 Unsupervised Sentiment Analysis

+0

컨텍스트/도메인에 관해서는 단어마다 다른 감정이 있으면 다른 Wordnet 감각이어야한다고 생각합니다. 예 : love # 5 (테니스 도메인) 대 http://sentiwordnet.isti.cnr.it/search.php?q=love의 다른 의미 대 단어가 다른 상황에서 다른 의미를 가질 수있는 반대 사례가 있습니까? 하지만 자체 Wordnet 감각을 가질 수는 없습니까? –

1

는 SentiWordNet에 대해 서로 다른 의견을 제공하는 인터페이스가 당신이 언급 한 번호. online search에는 표시되지 않습니다.

그래서 두 가지 이유로 SentiWordNet을 사용하시기 바랍니다.

(나는 당신의 질문은 세입니다 참조, 그래서 아마 당신은 당신과 함께 할 것입니다 무슨 짓을했는지 우리가 말할 수있는, 그 이유는 무엇입니까?)

-1

극성의 정도는에없는 단어 만에 혼자뿐만 아니라 따라 달라집니다 문장이나 문구의 문맥. 그래서 동일한 단어에 대해 다른 결과가있는 경우 문맥의 차이 때문입니다.