이 규칙을 위반하면이 사이트와 새로운 클러스터 분석에 익숙하지 않으므로 사과합니다.클러스터 3.0의 계층 적 클러스터 분석
저는 클러스터 3.0을 사용하여 유클리드 거리와 평균 연결로 계층 적 클러스터 분석을 수행했습니다. Cluster 3.0은 노드와 유전자의 유사성 점수를 결합한 .gtr 파일을 출력합니다. .gtr 파일의 첫 번째 줄은 항상 다른 유전자와 유전자를 연결 한 다음 유사성 점수를 표시합니다. 그러나이 유사성 점수는 어떻게 재현합니까?
내 데이터 세트에서 8 개의 유전자가 있고 d_ {ij}가 유전자 i와 유전자 j 사이의 유클리드 거리를 포함하는 거리 행렬을 만듭니다. 그런 다음 각 요소를 행렬의 최대 값으로 나눠서 행렬을 정규화합니다. 유사도 행렬을 얻으려면 모든 요소를 1에서 뺍니다. 그러나 결과는 연결 유형을 사용하지 않고 출력 유사성 점수와 다릅니다.
저는 링크가 첫 번째 노드의 유사성 (가장 가까운 두 유전자의 합류)과 유사성 점수 계산 방법에 주로 어떻게 영향을 미치는지 혼란 스럽습니다.
감사합니다.
어떤 유사 기능이 클러스터 3.0을 사용하며, 사전에 데이터를 사전 처리 (규모 조정) 했습니까? –