일반적으로 실수 벡터 만 사용하는 Kohonen 맵/SOM 알고리즘을 구현하는 것은 상대적으로 쉽지 않습니다. 나는 "weight update"단계로 인해 텍스트 문자열과 같은 실제가 아닌 (즉, 비 스칼라) 속성에 대해 이러한 알고리즘을 구현하는 방법을 생각합니다.비 스칼라 입력 데이터/속성을 사용하여 Kohonen 맵 (SOM)을 구현하는 방법
장미 (매우 낭만적 인), 꽃 (낭만적 인), 식물 (문맥에 따라 낭만적 인)과 같은 다양한 길이, 의미 클래스 및 낭만주의 등급을 포함하는 데이터 집합이 있다고 가정합니다. 공장 (steampunkers 만 낭만적 인). 나는 그것을 만들고있어, 그래서 세부 사항을 무시하십시오. (편집 : 예, 로맨틱 네스는 스칼라 값으로 표현 될 수 있으며, 내 질문은 정말로에 대한 부분입니다.)
한 다음지도에 프로토 타입을 생성하는 단어 또는 문자를 섞고 수 Levenshtein 거리를 사용하여 가장 일치하는 유닛을 찾으십시오. 그러나 어떤 방법으로 을 BMU와 그 이웃을 선택된 대상 벡터쪽으로 업데이트 할 수 있습니까?
다른 예로는 1 차원 (스칼라) 데이터 스트림에 포함 된 그림 (예 : 색, 테마, 시대, ...) 또는 감지 된 모양 (예 : 삼각형, 톱니 모양, ...)이 있습니다.
요즘이 문제에 대해 생각해 볼 때 해결책은 정량의 벡터 공간 삽입을 얻는 것이라고 가정합니다. 문제의 예측 인자 (단어 'word2vec'가 떠오른다.)를 기반으로 클러스터를 만든다. – sunside