2017-10-24 8 views
0

인코더를 사용하여 데이터 세트를 클러스터링하려고합니다.이 필드에서 새로운 것이므로 어떻게 할지를 말하지 않습니다. 주요 문제는 데이터 세트가 레이블이 지정되지 않았기 때문에 손실 함수를 정의하는 방법입니다 그리고 내가 알고있는 것으로, 그들이 원하는 출력과 예상 된 출력 사이의 거리를 손실 함수로 정의하는 참고 문헌에서 본 것은 무엇입니까? 내 질문은 내가 원하는 출력을 갖지 못하기 때문에 어떻게 구현해야합니까?자동 엔코더 기반 무 감독 클러스터링

답변

0

당신이 형태의 코드를 볼 수 있듯이 이미지

을위한 길쌈 autoencoder의 사용과 내 질문에 here 설명처럼 당신은, 당신의 길쌈 층을 사전에 훈련을 자동 인코더를 사용할 수, 손실 함수는 측정 정확도와 아담 주사위 계수는 주사위 계수가 이미지에 따라 다르기 때문에 정확도 만 사용할 수 있다고 생각합니다.

참고 문헌 목록을 어떻게 변형 할 지에 대한 아이디어를 제공하지 않았기 때문에 어떻게 효과가 있을지 모르겠습니다. vector로 복사 할 때, 아마도 그들 사이의 코사인 (cosine) 거리로 정렬 된 참고 문헌 ID 목록을 만들 것입니다.

는 엔코더가 훈련 될 것입니다 후

, 당신은 제거 할 수 있습니다 예를 들어, 데이터 집합의 각 참조를 위해 위의 참고 문헌 목록의 각 항목에 코사인 거리 벡터의 집합을 사용할 수 있으며 autoencoder

에 대한 입력으로 사용 모델 출력의 디코더 부분을 사용하고 감독되지 않은 클러스터링 알고리즘 중 하나 (예 : k-mean)에 대한 입력으로 사용합니다. 그들에 대한 세부 사항을 찾을 수 있습니다 here