1

커널 밀도 추정기의 경우, 아래 언급 된 것처럼 확률 밀도 함수를 계산하는 데 사용됩니다.2 차원 커널 밀도 추정에 대한 혼동 R

내 혼란이 정확하고 kde2d을 무엇에 관한 것입니다? 아래의 예에서 두 개의 확률 변수 - f (a, b)의 공동 분포 확률 밀도 함수를 추정합니까? 그리고 그 색깔은 무엇을 의미합니까?

다음은 내가 언급 한 코드 예제입니다. 사전에

b<-log10(rgamma(1000,6,3)) 
a<-log10((rweibull(1000,8,2))) 
density<-kde2d(a,b,n=100) 
filled.contour(density,color.palette=colorRampPalette(c('white','blue','yellow','red','darkred'))) 

덕분에, 린

+1

'두 개의 확률 변수의 접합 분포 확률 밀도 함수를 계산합니까?'- 예. 'rv1','rv2','estimated probability'의 세 축을 가지고 있기 때문에'2d' 그래프에 색을 표시 할 수 있도록 색칠을해야합니다.따라서 확률을 색상 코드화하고 등고선의 등고선을 그릴 수 있습니다. 등고선에 대한 자세한 내용은 wikipedia를 참조하십시오. https://en.wikipedia.org/wiki/Contour_line – cel

+1

'kde2d'의 소스 코드를 살펴보십시오. 2d 정상적인 커널 밀도 추정치가 두 개의 1d 정상 kdes의 곱인 것을 알게되면 종종 2d kde를 명확하게하는 것이 쉽습니다. – shayaa

+0

@cel 감사와 투표까지 ** 어두운 ** 색상은 ** (**, **) **보다 ** 확률이 높음을 의미합니다. 맞습니까? ** darkred ** 영역에서, 무작위 변수'x'와'y'는 ** white **보다 상관 관계가 더 높음을 의미합니까? –

답변

5

커널 밀도 추정은 무엇인가? 기본적으로 데이터의 모든 점 (그 점인 정상 밀도의 중심)에 약간의 표준 밀도 곡선을 맞추고 모든 작은 정상 밀도를 커널 밀도 추정기에 더합니다.

설명을 위해 one of your links에서 1 차원 커널 밀도 측정기의 이미지를 추가합니다. enter image description here

지금까지 우리는 1D 커널 밀도 측정기가 무엇인지 신속하게 논의했습니다.

2 차원 커널 밀도는 어떻습니까?

# library(MASS) 
b <- log10(rgamma(1000,6,3)) 
a <- log10((rweibull(1000,8,2))) 
# a and b contain 1000 values each. 

density <- kde2d(a,b,n=100) 

함수 min(a)에서 max(b)max(a)min(b)에 격자를 생성한다. a 또는 b의 모든 값 위에 작은 1D 표준 밀도를 맞추는 대신, kde2d은 이제 눈금의 모든 점에 대해 2D 2D 표준 밀도에 맞습니다. 1 차원 경우 커널 밀도와 마찬가지로 모든 밀도 값을 더합니다.

색상의 의미는 무엇입니까? 의견에서 지적한 바와 같이 예상 확률은 두 변수에 따라 달라 지므로 이제 세 축이 있습니다 (a, bestimated probability). 3 축을 시각화하는 한 가지 방법은 등 확률 등고선을 사용하는 것입니다. 이것은 환상적이지만, 기본적으로 우리가 일기 예보로부터 알고있는 고/저압 이미지와 같습니다.

당신은 로우에서 하이로 그래서
filled.contour(density,color.palette = colorRampPalette(c('white', 'blue', 
                  'yellow','red', 
                  'darkred'))))) 

를 사용하는

는 줄거리는 white, blue, yellow, red 추정 확률의 가장 높은 값을 결국 darkred 색이됩니다.

+0

감사합니다 켄, 투표까지. 그래서 내 코드 예제에서, ** 어둡게 ** 색상은'(x, y)'에 대해 ** white **보다 더 높은 확률을 의미합니다. 맞습니까? ** darkred ** 영역에서, 무작위 변수'x'와'y'는 ** white **보다 상관 관계가 더 높음을 의미합니까? –

+1

@LinMa 나는 포스트를 편집했다. 색상은 ** 상관 관계를 나타내지 않으며 추정 된 접합 밀도의 값을 나타냅니다. 'kde2d'는'a'와'b' 사이의 관계를 모델링하기 위해 공분산 행렬을 포함하지 않으므로'a'와'b'에서 값의 독립성을 가정합니다. 즉'a'와'b'가 있습니다. 무관계. –

+0

감사합니다. 켄, 답장에 대해 투표하십시오. 나는 더 깊은 색 (당신의 예에서는 검은 색)에 대해 더 높은 밀도를 의미한다고 생각합니다. 이것은 a와 b가 그러한 어두운 영역에서 가장 많이 발생한다는 것을 의미합니다. 맞습니까? 그것이 맞다면, 왜 우리는 "a"를 결론 지을 수없고 "b"는 어두운 지역에서 더 높은 상관 관계를 갖는가? –