2014-06-19 2 views
0

GPML 도구 상자를 사용하여 회귀에 대한 가우스 프로세스를 수행하고 있습니다. 그러나 'minimize.m'을 사용하여 최적화 한 후에 (평균 함수가없는 경우), 음의 하이퍼 매개 변수가 생깁니다.가우스 프로세스, 음수 하이퍼 파라미터?

초기 하이퍼 파라미터는 :

hyp.cov = [0; 0]; % two hyper-parameters in covariance kernel (length-scale & amplitute) hyp.lik = log(0.1); %hyper-parameters of noise

원래 학습 데이터 내 코드에서

x=[819 1119 1419 1599 1719 1839 1899 2019 2079 2139]; %coordinates 

y=[105.00 114.33 126.33 130.33 116.33 103.00 103.00 124.67 122.67 109.00]; %training data 

, Y는 제로 평균 및 단위 분산을 갖도록 NORMALIZED이다. 그런 다음 최적화 :

hyp = minimize(hyp, @gp, -100, @infExact, [], {@covSEiso}, likfunc, x,y); 

약 100 회 반복 한 결과, 음수 하이퍼 파라미터가 생깁니다. 그것은 매우 혼란 스럽습니다 ....

그러나 y를 정규화하지 않으면 최적화 후에 모든 하이퍼 매개 변수가 양수가됩니다.

음수 하이퍼 매개 변수는 무엇을 의미합니까? 데이터를 표준화해야합니까?

+0

하이퍼 파라미터는'exp (log (\ theta))'로 정의되므로, 음의 하이퍼 파라미터를 얻더라도 정의에 의해 양수로 제한됩니다. –

답변

0

실수는 이미 초기 잡음 매개 변수가 음수이다 :

hyp.lik = log(0.1); %hyper-parameters of noise 

그래서 나는 당신이 긍정적 인 잡음 분산을 사용하고 다시 시도 suggset 것입니다.

다른 질문에 대해서는 그렇습니다. 데이터를 정규화 (즉, 제로 평균 및 단위 분산 제공)하는 것이 좋습니다.

이 문제가 중앙 데이터에만 발생하는 이유는 분산이 원본 데이터의 분산보다 작아 질 수 있기 때문일 수 있습니다. Bayesian Linear Regression (원칙적으로 어떤 가우스 프로세스)에서 잡음 분산은 단순히 공분산 행렬에 추가된다는 것을 기억하십시오. 귀하의 경우,이 가수는 음수이며, 그 효과는 물론 분산이 작을수록 커집니다.

-1

GPML 도구 상자의 하이퍼 매개 변수는 로그로 표시됩니다. 따라서 실제 길이 - 스케일 값을 얻으려면 벡터에서 exp (X)를 수행하십시오.