2014-01-13 4 views
0

Google Prediction API에 대해 읽었으며 문서의 일부를 알 수 없습니다.감정 분석 Google 예측 API

나는이 부분에 조금 붙어 오전 use cases에서

: 각 행은 하나 개의 라벨을 할당 할 수

,하지만 당신은 다른 레이블을 예를 반복하고 적용하여 다수에게 하나의 예에 라벨을 적용 할 수 있습니다 각자에게. 예 : '흥분', 'OMG! 그냥 일 전날 멋진 시간을 보냈습니다!' "성가시다", "세상에, 그냥 멋진 하루 되셨다!" 트위터 을이 모델에 보내면 "excited": 0.6, "annoying": 0.2와 같은 분류가 나올 수 있습니다.

왜 "흥분하다": 0.6, "성가신": 0.2 이상 흥분되는 기능이없는 동안. 흥분된 이유는 무엇입니까?

답변

2

"흥분한"태그가 선호되는 것이 아니라 메시지가 사실 "흥분된"것으로 분류되어 "짜증이 나지 않는"것으로 분류 될 확률입니다.

"완고한"및 "약세"라는 두 가지 분류가 있다고 가정합니다. 그런 다음 예측 API에서 "완고한"및 "곰 같은"교육 데이터를 사용하여 모델을 교육합니다. Prediction API에 메시지를 제출하여 정서를 얻으면 텍스트를 읽고 메시지의 단어를 기반으로 "완고한"확률과 "약세"확률을 모두 할당합니다. 확률의 합은 1이 될 것입니다.

다시 한 가지 레이블이 다른 레이블보다 우선하지만 메시지가 "흥분"되는 확률이 "짜증이났다"는 것보다 3 배 더 큽니다.

+1

예 위의 예에서 확률이 1이되지는 않습니다. 제가 묻는 경우입니다. 두 문장의 내용이 같은데도 왜 태그에 6 가지 확률을 할당 했습니까? –

+1

문서 오류라고 생각합니다. 네가 옳기 때문에 확률은 1에 가깝다. 나 자신의 분류 모델을 테스트 할 때, 내가 테스트 한 모든 인스턴스가 1을 더했다. –

+1

감사. 그게 분명해! –

1

"OMG! Just a great day!"와 같은 두 가지 예제만으로 모델을 훈련하면 "OMG!"와 같은 트윗 분류를 쿼리 할 때 유일한 합리적인 결과입니다. 그냥 멋진 하루 되셨 어! " "흥분"해야합니다 : 0.5, "성가신": 0.5.

Google 문서에서 사례가 완벽하게 설명되지 않았을 수 있습니다. 나는 그들이 똑같은 문장으로 서로 다른 두 개의 레이블을 연관시키는 것이 가능하다는 것을 설명하려고 더욱 집중하고 있다고 생각한다.

+1

네, 그래도 지금은 –