2015-01-17 5 views
0

특정 견적 도구에 대한 바이어스 및 분산이 실제로 무엇인지 이해하는 데 어려움이 있습니다. 그것은 위키 피 디아에서 찾을 수 있습니다 나는이 바이어스의 정의와 함께 일하고 있어요ParzenWindows의 바이어스를 분석적으로 계산하십시오.

는 :

Bias of an estimator

우리는

Wikipedia definition of kernel density estimate

으로 커널 밀도 추정을 정의하지만 어떻게 할 수있는 경우 이것을 커널 밀도 추정에 적용하거나 더 정확한 Parzen Windows로 만들려고합니까? 누군가가 적어도 예상 밀도 f_hat (x)가 Bias (그리고 Variance)와 어떤 관련이 있는지 아이디어를 줄 수 있습니까?

질적으로 전체 데이터 공간을 포함하는 상자 창은 추정 된 밀도가 단순히 전체 학습 데이터 세트의 평균이 될 것이므로 최대 바이어스 및 분산을 가질 것이라고 이미 말할 수 있습니다.

답변

0

나는 그저 내 자신을 알아 냈다고 생각합니다. 밀도 추정의 경우 매개 변수 theta는 .. 드럼 롤 ... 밀도 함수 f (x)입니다. 따라서 바이어스

로 정의 바이어스 = E [f_hat (X)] - [(X) f_hat] 항은 기대 값 또는 는 F (X)

전자의 의미 창 기능. 계산에는 간단한 통합이 포함됩니다.

는 F (X)는 현실에 알 수있을 가능성이 데이터의 진정한 밀도 함수이다.