2009-11-18 11 views
4

this FAQ에 따르면 libsvm의 모델 형식은 간단해야합니다. 그리고 사실 그것은 단지 svm-train으로 전화 할 때입니다. 나는 easy.py 스크립트를 사용하는 경우 예를 들어, a1a 데이터 세트에 대한 첫 번째 SV 반면에libsvm 모델 파일 형식

1 3:1 11:1 14:1 19:1 39:1 42:1 55:1 64:1 67:1 73:1 75:1 76:1 80:1 83:1 

입니다, 내 첫 번째 SV는 끝낸다 :

512 1:-1 2:-1 3:1 4:-1 5:-1 6:-1 7:-1 8:-1 9:-1 10:-1 11:1 13:-1 14:1 15:-1 16:-1 17:-1 18:-1 19:1 20:-1 21:-1 22:-1 23:-1 24:-1 25:-1 26:-1 27:-1 28:-1 29:-1 30:-1 31:-1 32:-1 33:-1 34:-1 35:-1 36:-1 37:-1 38:-1 39:1 40:-1 41:-1 42:1 43:-1 44:-1 45:-1 46:-1 47:-1 48:-1 49:-1 50:-1 51:-1 52:-1 53:-1 54:-1 55:1 56:-1 57:-1 58:-1 59:-1 61:-1 62:-1 63:-1 64:1 65:-1 66:-1 67:1 68:-1 69:-1 70:-1 71:-1 72:-1 73:1 74:-1 75:1 76:1 77:-1 78:-1 79:-1 80:1 81:-1 82:-1 83:1 84:-1 85:-1 86:-1 87:-1 88:-1 90:-1 91:-1 92:-1 93:-1 94:-1 95:-1 97:-1 98:-1 99:-1 100:-1 101:-1 102:-1 103:-1 104:-1 105:-1 106:-1 107:-1 108:-1 109:-1 110:-1 112:-1 113:-1 114:-1 115:-1 117:-1 118:-1 119:-1 

인스턴스입니다 내 훈련 세트에 전혀 존재하지 않는다! 사실 내가 할 경우 : 119 인스턴스 없다

$ grep "119:" a1a 
-1 1:1 6:1 18:1 22:1 36:1 42:1 49:1 66:1 67:1 73:1 74:1 76:1 80:1 119:1 
-1 1:1 6:1 18:1 26:1 35:1 43:1 53:1 65:1 67:1 73:1 74:1 76:1 80:1 119:1 
-1 2:1 6:1 15:1 19:1 39:1 42:1 55:1 62:1 67:1 72:1 74:1 76:1 78:1 119:1 
-1 4:1 6:1 16:1 21:1 35:1 44:1 49:1 64:1 67:1 72:1 74:1 76:1 78:1 119:1 
-1 2:1 6:1 14:1 30:1 35:1 42:1 49:1 65:1 67:1 72:1 74:1 76:1 78:1 119:1 
-1 2:1 6:1 17:1 20:1 37:1 40:1 57:1 63:1 67:1 73:1 74:1 76:1 80:1 119:1 
-1 5:1 6:1 18:1 22:1 36:1 40:1 54:1 61:1 67:1 72:1 75:1 76:1 80:1 119:1 
-1 5:1 6:1 17:1 26:1 35:1 42:1 53:1 62:1 67:1 73:1 74:1 76:1 80:1 119:1 

: -1 (심지어 그냥 -1+1 교환있어 경우, 119 인스턴스가되지 않습니다 : 중 1 : 1 (118) - 누락 된 속성은 0입니다.

이 경우 source code modification을 보면 분명히 전의 경우 (svm-train 만 포함) 첫 번째 SV도 첫 번째 인스턴스임을 알 수 있습니다. 그러나 후자의 경우 (예 : easy.py 스크립트 사용) 어떤 인스턴스가 SV인지를 알려주는 출력은 grid.py

무엇입니까?

답변

8

여기에 범인은 아마도 easy.py가 [-1,1] 안에있는 각 속성의 크기를 조정하는 svm-scale 호출이라고 생각합니다. svm-train으로 전송 된 교육 예제는 교육 파일에있는 것과 동일한 것이 아닙니다.

+0

당신은 맞습니다, 바보 같은 질문입니다. 당신의 답은 +20입니다! – Davide