단일 값을 저장하지 않고 확률 분포 저장

조작 중에 많은 부동 소수점 값을 계산합니다. 모든 것을 메모리에 저장하고 싶지는 않지만 컬렉션의 대략적인 배포를 저장하려고합니다.단일 값을 저장하지 않고 확률 분포 저장

내 생각은 모든 값의 지수를 결정하고 히스토그램에서 계산하는 것이 었습니다. 그러나 이것은 물론 값이 다른 지수를 갖는 경우에만 작동합니다.

배포판의 모양을 모른 채 어떻게 할 수 있습니까?

2016-07-07 RomCoo

그것에서 재구성 한 후 PDF를 배포의 순간을 -THE-비행하고, 당신이 얼마나 기질이 좋은지에 달려 있습니다. 또한 다양한 가치관에 대해 알고 있습니까? 그것들은 모두 0에서 1 백만 사이입니까? –

나는 무작위로 일부를 저장하고 그 다음에 히스토그램을 작성하는 것이 좋습니다. 예를 들어 무작위로 0.1 %의 숫자를 저장하면 10 만 개를 저장하면되므로 매우 정확한 분포를 계산할 수 있습니다.

1..2000 범위의 임의 번호를 찾기 위해 번호를 저장할 때마다 전화를 걸어 다음 번호를 기다린 후에 rand() 호출 횟수를 줄일 수 있습니다.

2016-07-07 17:44:43 btilly

입력 데이터가 충분히 랜덤/고르게 분포되어 있으면 모든 _n_th 데이텀을 샘플링하는 것만으로도 멀어 질 수 있으며 난수 생성기가 필요하지 않습니다. – Tomboyo

@ Tomboyo 나는 그것을 생각했지만, 개인적으로 너무 많은 "동기화 유물"을보고 싶어했습니다. – btilly

동의합니다. "매 n 번째"샘플링으로 왜곡 된 결과를 자주 얻었습니다. –

대략적으로 최대 값을 알고 있다면 비닝 전략을 선택하는 것이 좋습니다. 이 번호는

2016-07-07 18:09:01 Darthtater

는 또 다른 유용한 대안에 계산하는 것 그 빈 증가 들어가 빈 찾기 내 모든 번호는 을 필요로 얼마나 많은 쓰레기통 밖으로

그림 : 여기에 내가 무엇을 의미하는지에 대한 개요입니다 순간

2016-07-13 19:39:16

답변