2013-03-11 2 views
1

Kohonen 자체 구성지도를 사용하여 숫자 데이터를 클러스터링 할 수있는 프로그램을 만들고 있으며 최대한 일반화하려고합니다. 그래서 데이터 집합의 항목 수 (출력 노드 수)에 비례하여 이웃의 적절한 초기 크기를 어떻게 알 수 있습니까?적절한 주변 크기 SOM

제안 사항도 크게 환영합니다. :)

답변

0

"가능한 한 일반적으로"사용하려면 임의 번호 일 가능성이 있습니다. 하지만 "덜 일반화"하도록 제안하고 매개 변수로 재생할 수 있습니다 ...

+0

데이터 집합의 요소 수와 알고리즘의 인접 크기 사이에 어떤 연결이 있습니까? 나는 항상 데이터 집합에 더 많은 요소가 있다면 이웃 크기가 더 커야한다고 생각 해왔다. 그러나 나는 그것의 최적 비율을 모른다. 그런 다음 다시, 나는 단지 추측하고 있습니다. 그래서 나는 여기서 질문을했습니다. – libzz

+0

잘 AFAIK 당신이 잘 선택된 데이터 세트에 잘 훈련 된 시스템을 가지고 있다면 그러한 연결이 있어서는 안됩니다. 하지만 둘 다 가지고 있니? ;) – xhudik

+0

데이터 세트가 더 커지면 이웃 크기를 더 크게 만들었습니다. 그래도 여전히 잘 작동합니다. 나는 그것을 더 좋게 만드는 방법을 찾고 있습니다. :) 입력에 감사드립니다. 대단히 감사합니다. ^^, – libzz

1

원하는대로 이웃 함수를 구체화 할 수 있습니다.

각 최적 일치 단위 (BMU) 주위에 원을 정의하면이 반지름을 저 차원 공간에서 그리드의 크기에 비례하도록 선택할 수 있습니다 (2 차원). 그런 다음 반경을 일정하게 유지하거나 마지막 반복까지 특정 기준에 따라 축소 할 수 있습니다.

또 다른 옵션은 주변 노드를 특정 양의 BMU와 같이 고정시키는 것입니다.