데이터 집합의 특이점을 결정하기 위해 Scikit의 한 클래스 SVM 분류 자 OneClassSVM
을 사용하고 있습니다. 내 데이터 세트에는 1024 개의 변수가있는 30000 개의 샘플이 있습니다. 나는 그 중 10 퍼센트를 훈련 자료로 사용한다.OCSVM in scikit : 외곽 거리는 항상 음수입니다.
clf=svm.OneClassSVM(nu=0.001,kernel="rbf",gamma=1e-5)
clf.fit(trset)
dist2hptr=clf.decision_function(trset)
tr_y=clf.predict(trset)
는 위와 I는 decision_function(x)
함수를 사용하여 결정 함수로 각 샘플의 거리를 계산한다. 예측 결과와 거리 결과를 비교할 때 예측 출력에서 +1로 표시된 샘플의 경우 양의 거리를 표시하고 -1로 표시된 샘플의 경우 음의 거리 값을 표시합니다.
방향을 다루지 않으므로 거리에 사인이없는 줄 알았습니다. 거리를 계산하는 방법을 이해하고 싶습니다 OneClassSV
분류기 분류. 이 기호는 SVM에 의해 계산 된 결정 초평면에 표본이 있다는 것을 단순히 나타 냅니까?
도와주세요. here 설명으로