2017-12-13 7 views
-1

저는 파이썬으로 지리적 클러스터 (네덜란드에서)를 만들려고합니다. 나는 HDBSCAN/haversine과 numpy/kmeans2를 사용했으나 둘 다 이상한 결과를 얻었습니다. 클러스터는 수평 적입니다 ... 누구든지 아이디어를 올바르게 수행하는 방법은 무엇입니까? 코드를 보지 않고파이썬에서 지오 클러스터링이 이상한 결과를 보여줍니다.

Weird clusters on NL

+1

결과를 재현 할 수 있도록 질문을 편집하여 [Minimal, Complete, Verifiable example] (https://stackoverflow.com/help/mcve)을 작성하십시오. – roganjosh

답변

0

이 (는 재현의 코드 포함), 나는 당신이 x 축 사용하지 않은 가정 것입니다.

sklearn은 fit(x,y)을 수락하지만 y (분류 용 레이블이라고 가정 됨)를 무시하는 (어리석은) 동작을합니다. 이것은 예를 들어, pyplot.scatter, 여기서 x와 y를 따로 전달해야합니다.

x은 모두 컬럼을 포함하는 매트릭스 여야합니다. haversine을 사용하면 올바른 축척 (라디안입니까?) 및 올바른 순서 (경도 먼저 또는 위도 우선, 이됩니다. 기억이 안 나기 때문에 문서를 읽으십시오).

코드를 모르면 추측 할 수 있습니다.

0

감사합니다. 나는 x와 y를 바꿨다. .. 어리 석다.