2013-12-17 4 views
0

나는 아주 영속적 인 질문을 가지고있다. 레이블이 지정된 데이터 집합 (예 : 대상 정보가있는 데이터 집합)으로 신경망을 학습 한 다음 레이블없이 다른 데이터 집합을 적용 할 수 있습니까?레이블이있는 학습 세트로 신경 네트워크를 학습하고 레이블이없는 데이터 세트로 테스트 할 수 있습니까?

나는 예제를 가지고 네트워크를 훈련시키고 싶지만, 실제 상황에서는 예제를 분류하기를 원한다.

교육 SET : 예를 들어

Var1 Var2 Var3 Var4 Target 
1  2  3  1  blue 

는 테스트

Var1 Var2 Var3 Var4 
1  2  3  1  

에게 가정 해 예측을 (내가 알고 싶은거야 그 사실에 대상이없는) 설정 파란색이어야합니다.

신경망을 테스트하는 데 빠른 광부를 사용하고 있지만 곧이 테스트 세트를 적용 할 수 없다는 것을 알게되었습니다. 라벨을 놓치기 때문입니다.

그럼 어떻게 문제를 해결할 수 있습니까? 이 문제에 대한 감독되지 않은 신경 네트워크를 탐색해야하는지 궁금하지만 솔직히 그렇게 생각하지 않습니다.

종류 감사합니다.

+1

첫 번째 질문에 대한 대답은 "예"입니다. 사전 분류 된 입력을 필요로하는 훈련 된 분류기는 전적으로 쓸모가 없습니다. –

답변

1

감독 학습을 위해 레이블이있는 교육 세트를 사용하여 갖고있는 모델을 학습 할 수 있습니다. 그런 다음 모델을 사용하여 레이블이없는 세트의 레이블을 예측할 수 있습니다.

테스트 세트에 대한 레이블이있는 경우 예상 값을 테스트 세트 레이블과 비교할 수 있습니다. 예측 오류를 평가할 수 있습니다 (예 : 모델 테스트, 따라서 이름 - 테스트 집합)

예측에만 관심이있는 경우에는 라벨이 필요하지 않습니다.

1

레이블이없는 데이터 세트에 분류 자 ​​(mlp와 같은 nn 포함)를 적용하면 분류 기준을 실제로 사용하게됩니다. 그러나 test이라고 말하면 false alarm rate 또는 precision과 같은 품질 척도를보고 싶다는 뜻입니다.이 작업을 수행하려면 레이블이 필요합니다.

분류기를 훈련시킨 다음 실제 케이스에서 사용한다고 가정하면 테스트 데이터를 이전에 사용하여 가장 바람직한 정밀도를 가진 모델을 사용하는 것이 좋습니다. 그렇지 않으면 당연히 귀찮게합니다 많은 거짓 예측을 할 수 있습니다.

샘플이 거의없는 레이블이 지정된 데이터 세트가있는 경우 k-fold 인증을 시도 할 수 있습니다.