2016-07-01 10 views
3

가우스 (정규) 확률 변수의 평균과 분산을 구하면 그 확률 밀도 함수 (PDF)를 계산하고 싶습니다. 나는이 게시물에 언급 enter image description herescipy.norm.pdf가 때때로 PDF> 1을 제공하는 이유는 무엇입니까? 그것을 고치는 방법?

: Calculate probability in normal distribution given mean, std in Python를, 또한

scipy 문서 : scipy.stats.norm

하지만 곡선의 PDF를 그릴 때, 확률이 1을 초과! 이 최소한의 작업 예를 참조하십시오

Gaussian PDF Curve

방법은 평균, 1.075를 얻기 위해 200 %의 확률을 가지고도 가능하다 :

import numpy as np 
import scipy.stats as stats 

x = np.linspace(0.3, 1.75, 1000) 
plt.plot(x, stats.norm.pdf(x, 1.075, 0.2)) 
plt.show() 

이 내가 무엇을 얻을? 내가 여기서 뭐라 잘못 해석 한거야? 이 문제를 해결할 방법이 있습니까?

+0

사용중인 기능에 대한 설명서를 읽으셨습니까? 마지막 인수는 배율 인수입니다. 당신은 1/0.2 – talonmies

+0

에 의해 결과 PDF를 곱하기 위해 scipy에게 말하고 있습니다. 나는 실제로 그렇게했습니다. @ talonmies. 표준 .pdf 자체는 표준화 된 확률 변수에 사용되므로'exp (-x ** 2/2)/sqrt (2 * pi)'를 계산합니다. 뮤와 시그마를 관계에 도입하기 위해 각각 'loc'과 'scale'이 도입되었습니다. 이것들을 지정하는 것은 x를 (x-loc)/스케일로 대체하고 최종 결과를 스케일로 나누어 위와 같이 가우스 PDF를 형성하는 것을 의미합니다. –

답변

10

이것은 버그가 아닙니다. 그것은 잘못된 결과도 아닙니다. 확률 밀도 함수의 값은 특정 시점에서 확률을 제공하지 않습니다. 그것은 밀도가 인 분포를 측정 한 것입니다. 연속 확률 변수의 경우 주어진 점에서의 확률은 0입니다. p(X = x) 대신에 우리는 2 점 p(x1 < X < x2) 사이의 확률을 계산하며 그 확률 밀도 함수 아래의 영역과 같습니다. 확률 밀도 함수의 값은 1보다 훨씬 높을 수 있습니다. 무한대까지 접근 할 수도 있습니다.

+0

설명해 주셔서 감사합니다. 나는 이것이 내 제품의 가능성을 어지럽 혀서 걱정했다. 답변을 수락했습니다. –

+3

@ ÉbeIsaac 대답에 포인트를 추가하려면 ** INTEGRAL ** PDF의 간격은 1입니다.하지만 PDF 자체는 1보다 작을 수 있습니다. 1보다 작을 수 있습니다. 물론 음수 일 수는 없습니다. –