2017-03-25 10 views
0

저는 현재 훈련 값의 작은 데이터 세트 (20 개 이하)로 작업 중이며 큰 MSE를 얻고 있습니다. 입력 데이터 벡터 자체는 16 개의 매개 변수로 구성되며, 대부분이 2 진 변수입니다. 모든 훈련 값에 걸쳐서, 16 ​​개 매개 변수의 대다수는 동일하게 유지됩니다 (단 모두이 아님). 나머지 모든 입력 변수는 모든 표본에서 서로 많이 다릅니다. 즉, 서로 다른 두 매개 변수, 한 매개 변수가 이진 변수, 다른 변수가 연속 변수 인 경우를 제외하고 두 가지 예가 동일 할 수 있습니다. 차이는 단일 표준 편차보다 클 수 있습니다 변수의 값 집합).작고 매우 다양한 데이터 세트를위한 제안 된 신경망?

내 현재의 단일 출력 변수는 연속 변수이거나 상황에 따른 오류를 줄이기위한 진정한 어려움에 따라 분류 대신 12 가지 다른 형식으로 분류 문제를 만들 수 있습니다.

Stochastic NN, Ladder NN 및 여러 형태의 반복적 인 NN으로 읽었던 피드 포워드 MLP의 현재 구현과 다른 신경 네트워크를 연구 해 왔습니다. 내가 사용할 수있는 모든 NN을 시도 할 시간이 없기 때문에 어느 하나를 조사해야합니까?

내 설명이 모호 할 수 있지만 누구나 내 네트워크 비용을 최소화하기 위해 조사해야하는 네트워크 (현재, MSE 기준)를 제안 할 수 있습니까?

네트워크가 가장 잘 작동 할 수있는 매우 다양한 변형 교육 값 집합에 대한 올바른 출력 예측과 관련된 어려움 때문에 내 현재 설정을 무의미하게 만들어야하는 경우 내 데이터 집합을 수천 예를 들어 (상당히 중복되고 겉으로보기에 동질적인 입력 값 집합을 사용하는 대신에)?

모든 도움을 받으실 수 있습니다.

답변

0

20 개의 입력 변수가있는 경우 특히 20 개의 샘플이 매우 작습니다. 이러한 입력 중 어느 것이 귀사의 산출물 가치에 책임이 있는지 판단하기가 어려울 것입니다. 네트워크를 단순하게 유지하면 (레이어 수 감소) 전통적인 회귀 분석에 필요한만큼의 샘플을 사용할 수 있습니다.