2016-07-07 7 views
1

조작 중에 많은 부동 소수점 값을 계산합니다. 모든 것을 메모리에 저장하고 싶지는 않지만 컬렉션의 대략적인 배포를 저장하려고합니다.단일 값을 저장하지 않고 확률 분포 저장

내 생각은 모든 값의 지수를 결정하고 히스토그램에서 계산하는 것이 었습니다. 그러나 이것은 물론 값이 다른 지수를 갖는 경우에만 작동합니다.

배포판의 모양을 모른 채 어떻게 할 수 있습니까?

+0

그것에서 재구성 한 후 PDF를 배포의 순간을 -THE-비행하고, 당신이 얼마나 기질이 좋은지에 달려 있습니다. 또한 다양한 가치관에 대해 알고 있습니까? 그것들은 모두 0에서 1 백만 사이입니까? –

답변

5

나는 무작위로 일부를 저장하고 그 다음에 히스토그램을 작성하는 것이 좋습니다. 예를 들어 무작위로 0.1 %의 숫자를 저장하면 10 만 개를 저장하면되므로 매우 정확한 분포를 계산할 수 있습니다.

1..2000 범위의 임의 번호를 찾기 위해 번호를 저장할 때마다 전화를 걸어 다음 번호를 기다린 후에 rand() 호출 횟수를 줄일 수 있습니다.

+0

입력 데이터가 충분히 랜덤/고르게 분포되어 있으면 모든 _n_th 데이텀을 샘플링하는 것만으로도 멀어 질 수 있으며 난수 생성기가 필요하지 않습니다. – Tomboyo

+0

@ Tomboyo 나는 그것을 생각했지만, 개인적으로 너무 많은 "동기화 유물"을보고 싶어했습니다. – btilly

+1

동의합니다. "매 n 번째"샘플링으로 왜곡 된 결과를 자주 얻었습니다. –

1

대략적으로 최대 값을 알고 있다면 비닝 전략을 선택하는 것이 좋습니다. 이 번호는