데이터 세트가 벡터에 있습니다. 데이터의 히스토그램을 그려 보면 (세 심하게 검사하여) 데이터가 세 분포의 합으로 분산된다는 것을 알 수 있습니다. 하나의 정규 분포가 분산 x_1을 중심으로 분산 s_1; 하나의 정규 분포가 분산을 갖는 x_2를 중심으로합니다. 일단 로그 정규 분포. 내 데이터는 분명히 '실제'데이터의 하위 집합입니다. 내가 원하는 것은
나는 스프레드에 대해 범위 델타, 시그마 및 생성해야하는 임의 값의 수를 지정하길 원합니다. 그러나 일반 Python으로 임의 값을 생성하는 Iron Python의 가장 좋은 방법은 무엇입니까? NumPy에서 NumPy의 기능을 찾았지만 제 생각에는 Iron Python에서는 작동하지 않습니다.
일괄 정규 분포 테스트를 시도하고 있습니다. 나는 각 Employee_ID에서 시간의 분포를 확인하고자 "Date","Department","Discipline","Employee ID","SumOfBillable Hrs"
"10/09/2012","D","B",50084.00,8.00
"10/09/2012","D","C",51870.00,10.00
"
혼합 다 변수 정규 분포에서 각 클래스에 대해 $ \ mu $, $ \ sigma $, $ \ pi $를 결정하는 알고리즘을 작성하려고합니다. 부분적으로 알고리즘을 끝내고, 실제 값 근처에서 임의의 추측 값 ($ \ mu $, $ \ sigma $, $ \ pi $)을 설정할 때 작동합니다. 그러나 실제 값과 멀리 떨어진 값을 설정하면 알고리즘이 수렴하지
우리의 앱에있는 기존 코드를 보면 Normal RNG의 이상한 구현을 발견했습니다. 적절한 Box-Muller 변환을 위해 교환하고 싶지만 격려가 필요합니다. 볼 수 있듯이 -3.875에서 +3.875 사이의 5 개의 난수를 생성 한 다음이를 평균하여 -1에서 +1까지의 준 정상 분포 값을 얻습니다. 아마도 이것이 옳을 수 있습니까? 이것도 어떻게 작동할까
나는 exp를 구현했다. 최대화 알고리즘을 사용하고 mu 및 sigma의 값을 올바르게 수렴하고 반환하므로 여러 가지 예를 살펴 보았습니다. 필자는 로그 가능성을 플로팅하려했지만 정확한 형식으로 어떻게 표시되는지 모르겠습니다. 여기 방정식은 다음과 같습니다. 그리고 플롯 y는 log-likelihood 값 x 반복 횟수 x입니다. 음수 값이 매우 이상합니다
다소 이해하기 쉬운 질문이 있습니다. 데이터 세트가 있는데이 데이터가 표준 정규 분포 인 에 얼마나 잘 맞는지 예상하고 싶습니다. 이렇게하려면 내 코드로 시작합니다. bell- 입력해도, 쉬운 적합은 매우 가난한 것을 볼 수 : [f_p,m_p] = hist(data,128);
f_p = f_p/trapz(m_p,f_p);
x_th = min(data