2010-04-16 8 views
3

로 입력을 정규화하는 것은의 코호 넨 신경망에 입력 그것은이다코호 넨 SOM지도 : "제프 히튼으로 자바와 신경망 소개에 따르면"알 수없는 범위

-1 1 사이의 값이어야합니다 범위를 미리 알고있는 입력을 정규화 할 수 있습니다. 범위가 0에서 255 사이의 값으로 알려진 RGB (125, 125, 125) 예 : 255로 나눕니다. (125/255) = 0.5 >> (0.5,0.5,0.5)
2. 2를 곱하여 1을 뺀다. ((0.5 * 2) -1) = 0 >> (0,0,0)

질문은 높이나 무게와 같이 범위를 알 수없는 입력을 표준화 할 수있는 방법입니다.

또한 다른 논문에서는 입력 값을 0에서 1 사이의 값으로 정규화해야한다고 언급했습니다. 올바른 방법은 "-1과 1"또는 "0과 1"입니다.

답변

6

항상 스쿼시 함수를 사용하여 무한 간격을 유한 간격으로 매핑 할 수 있습니다. 예 : 당신은 사용할 수 있습니다 tanh.

동일한 지역에 너무 많은 물체를 두지 않으려면 수동으로 선택한 것과 함께 tanh (x * l)를 사용하는 것이 좋습니다. 따라서 데이터의 최대 값이 +/- 500이라는 좋은 추측을 가지고 있다면, tanh (x/1000)를 매핑으로 사용하는 것이 좋습니다. 여기서 x는 객체의 값입니다. x에서 평균값을 추측하여 tanh ((x-mean)/max)를 산출합니다.

4

내가 Kohonen SOM에 대해 알고있는 것부터, 그들은 특정 정규화가 중요하지 않습니다.

글쎄, 학습 알고리즘의 매개 변수 값에 대한 구체적인 선택을 할 수도 있지만, 가장 중요한 점은 입력 지점의 다른 차원이 동일한 크기 여야한다는 것입니다.

각 데이터 요소가 세 개의 RGB 구성 요소가있는 픽셀이 아니라 국가의 통계 데이터가있는 벡터 인 경우를 예로 들어 보겠습니다. 면적, 인구 등등 ... 학습 부분의 수렴은 모든 숫자가 동일한 크기를 갖는 것이 중요합니다.

따라서 정확한 범위를 모르는 경우 중요하지 않으며 데이터의 특성 진폭을 대략 알아야합니다.

무게와 크기면 각각 200kg과 3m로 나누면 모든 데이터 포인트가 [0 1] 간격으로 떨어집니다. 50kg과 1m를 사용할 수도 있습니다. 중요한 것은 모든 좌표가 1이 될 것입니다.

마지막으로, POD와 같은 선형 분석 도구를 사용하면 자동으로 표준화 할 수있는 방법을 생각해 볼 수 있습니다 귀하의 데이터 및지도의 초기화를위한 부분 공간.

희망이 도움이됩니다.