~ 10.000 점의 좌표 (십진법의 latitute, longitute) 목록과 ~ 100 만 점의 동일한 유형 좌표의 두 번째 목록 B가 있습니다.다른 점에서 가장 가까운 점을 효율적으로 찾을 수 있습니다.
나는 목록 B.의 각 요소에 대한 목록 A의 가장 가까운 지점을 찾으려면
내가 이미 수행 한 것은 두 목록의 직교 제품을 만들고 하버 사인을 사용하는 모든 조합의 거리를 찾을 수있다 공식. 총 조합이 10 개 이상의 억, 거리를 계산하는 데 걸리는 시간이 너무 긴 때문에
은 그 때 나는 목록 B.
의 각 포인트의 최소 거리가 목록 A의 포인트를 얻을.
목록 B의 모든 점이 목록 A의 점과 일치하지만 성능을 향상시킬 수있는 방법이 있습니까?
질문에 자세한 내용을 추가하는 것이 좋습니다. 예상되는 최소 거리는 얼마입니까? 해당 면적은 얼마나 큽니까? 구의 어느 부분입니까? 'A' 크기가 고정되어 있습니까? 정확한 솔루션이 필요합니까? 데이터에 따라 작동하지 않을 수도있는 가장 간단한 방법은 작은 목록에 kdtree를 빌드하고 RDD를 통해 매핑하는 것입니다. – zero323