2013-03-04 3 views
0

첫째, "ANOVA"로 태그가 MANOVA에 관한 의한 죄송합니다, 모든 예제는 작은 행렬을 사용하여, 내가 찾은 튜토리얼에서MANOVA - 거대한 행렬

(... 아직 태그가 될) 다음 많은 연구들의 경우처럼 큰 사람들의 경우에는 가능하지 않을 것이다.

나는 14 개의 샘플링 포인트에 대해 2 개의 매트릭스를 얻었고, 1 개의 유기체 ID (4493 ID)와 1 개의 화학 프로파일 (190 개 변수)에 대해 2 개의 매트릭스를 얻었다.

2 개의 매트릭스는 spearman에 의해 상관 관계가 있고, 4 클러스터 (ku 평균은 평방 유클리드 클러스터링 값에 관한 것), 행의 ID 및 라인의 화학적 프로파일에 기초하여 상관 관계가 있습니다.

그들 사이의 차이점은 다소 명확하지만, 클러스터의 차이점을 보여주기 위해 MANOVA를 수행하기를 원합니다. 이것이 결론의 핵심 요소입니다.

8 시간 후에도 분석에 적합한 형식으로 데이터를 입력 할 수 없다는 문제가 있습니다.

내가 찾은 튜토리얼은 매우 적은 변수로 설계되었으며,이를 극복했다고 생각하더라도 프로그램은 내 행렬을 길이의 차이로 비교할 수 없다고 말합니다.

각 클러스터에는 모든 동일한 변수 집합을 공유하는 자체 ID 집합이 있습니다.

어떻게해야합니까?

미리 감사드립니다. 디오 오가와

답변

0

당신이 (거의 모든 데이터 세트에 포함하는 것) 데이터에 누락 된 값이있는 경우

당신이 그 관찰을 제거 할 수 있습니다 또는 당신이 그 관찰을 사용하여 모델을 만들 수 있습니다. 당신의 방법론에 대해 뭔가 다른 관찰이있을 것이라는 확신을 주면 첫 번째 접근법을 사용하십시오. 대부분의 경우 누락 된 값을 사용하여 모델을 실행하는 것이 좋습니다. 이 경우 평형 ANOVA 모델 대신 일반 선형 모델을 사용하십시오. 균형 잡힌 모델은 누락 된 데이터로 인해 어려움을 겪을 것입니다.