2016-09-07 4 views
0

데이터 집합을 사용하여 모델을 학습하고 싶습니다. 데이터 세트에는 세 가지 유형의 생리 데이터가 있습니다. libSVM의 형식은 다음과 같습니다. 레이블 색인 1 : 값 1 색인 2 : 값 2 ....libsvm에서 교육 및 테스트 파일 용 소스 데이터 파일을 만드는 방법은 무엇입니까?

이제 레이블을 유형 1로, 유형 2를 유형 2로 사용했습니다. 유형 3의 경우 3입니다. 모든 값이 1 : (값)으로 저장됩니다. 그래서, 내 훈련 및 테스트 파일은 아래와 같습니다.

1 : 값 \ n을 1 : 값 \ 없음 1 : 값 \ 없음 1 : 값 \ 없음 1 : 값 \ 없음 . . . 1 : 값 \ 없음 2 : 1 값 \ 없음 2 : 1 값 \ 없음 2 : 1 값 \ 없음 2 : 1 값 \ 없음 2 : 1 값 \ 없음 . . . 2 1 : 값 \ n 3 1 : 값 \ n 3 1 : 값 \ n 3 1 : 값 \ n 3 1 : 값 \ n . . . 3 1 : 값 \ n

그래서이 종류의 소스 파일을 사용하여 svm을 추적하고 유사한 종류의 소스 파일로 테스트합니다. SVM 데이터 형식을 올바르게 사용하고 있는지 확인하고 싶습니다. 당신이

답변

2

LIBSVM의 벡터 데이터 세트 형식이

label feature_id1:feature_value1 feature_id2:feature_value2 ... 
따라서

, 모든 기능 (또는 값)으로 정의해야한다 감사하는 고유 식별자입니다.

예 :

상상 당신은 세 가지 다른 클래스 레이블 1,2,3 및 기능 선택 메커니즘을 통해 얻은 a(id=1),b(id=2),c=(id=3) 구성된 기능 세트를 가지고있다.

그래서 예를 들어 것입니다, 우리는 세 개의 데이터 포인트 d1,d2,d3, 우리는 우리의 데이터 세트에서 설명 할 가지고, 이제 가정 해 봅시다 :

2 1:0.5325 3:0.523 

3 2:0.7853 3:0.6326 

1 1:0.53265 2:0.5422 

의미

  • d1는 기능 a(id=1)c(id=3) 포함
  • d2에는 기능이 포함되어 있습니다. b(id=2)c(id=3)
  • ,451,515,
  • d3는 주어진 데이터 포인트에 포함되지 않은 기능에 대한 feature_id1:feature_value1을 제공 할 필요가 없다고, 기능 a(id=1)b(id=2)

참고가 포함되어 있습니다.