이것은 Google App Engine에 적용 할 수 있지만 반드시 제한 할 필요는 없습니다.App Engine에 적용 가능한 배분 (및 백분위 수) 계산 분주금을 계산 하시겠습니까?
Google App Engine에서 데이터베이스는 관계형이 아니므로 집계 함수 (합계, 평균 등)를 구현할 수 없습니다. 각 행은 서로 독립적입니다. 합계와 평균을 계산하기 위해 앱은 데이터베이스에 대한 개별적인 개별 쓰기마다 다시 계산하여 계산을 상환해야합니다. 따라서 항상 최신 상태로 유지해야합니다.
백분위 수 및 도수 분포 (밀도)를 계산하는 방법은 무엇입니까? 나는 값의 필드의 밀도에 대한 그래프를 만들고 싶습니다.이 값의 집합은 아마도 수백만에 달합니다. 전체 데이터 세트 (각 쿼리에 대한 제한이 반환되는 1000 개의 행이 반환 됨)를 반복 할 수 있으며,이를 기반으로 계산하지만 차라리 몇 가지 현명한 방법을 사용하는 것이 좋습니다.
일정 기간 동안 계산할 수있는 밀도/빈도/백분위 수 분포를 계산하거나 근사화하는 알고리즘이 있습니까?
그런데 데이터의 최대 값과 최소값이 모든 곳에서있을 수 있다는 점에서 불확실합니다. 따라서 배포본은 데이터의 약 95 %를 차지해야하며이를 기반으로 한 밀도 만 수행해야합니다.
GAE는 작업을 수행하는 데 걸리는 시간과 데이터 저장소 CPU 시간을 제한합니다. 모든 것이 http 요청으로 처리되므로 요청 당 많은 양의 데이터를 처리 할 수 있습니다. 큰 작업을 여러 작업으로 나누고 결과를 결합하는 것이 간단한 방법이 있다면 너무 어려울 수 있습니다. –