2012-06-09 7 views
0

코사인 유사성 목록을 백분율로 변환하는 방법이 있습니까? 나는이 두뇌 주위에 내 두뇌를 감싸려고했지만 큰 의문의 여지가있다. 최대코사인 유사성을 정규화 할 수 있습니까?

0.9600 + 0.9300 + 0.8800 + 0.8500 = 3.6200 

모두 합산

DoC#1 0.9600 
DoC#2 0.9300 
DoC#3 0.8800 
DoC#4 0.8500 

을 그들 정상화 :

그것과 같이 네 개의 문서의 코사인 값을 정상화하는 것이 만들 것이다.

DoC#1 0.9600/3.6200 = 0.2652 
DoC#2 0.9300/3.6200 = 0.2570 
DoC#3 0.8800/3.6200 = 0.2431 
DoC#4 0.8500/3.6200 = 0.2348 

또는이를 표시의 더 허용 방법이 있습니다 무엇입니까?

답변

0

당신의 유스 케이스에 따라 다르 겠지만, 일반적으로 코사인 유사도 점수를 0에서 1로 스케일링 할 필요가 있다고 생각하지 않습니다.