2017-05-04 12 views
0

1000 개의 genomes 프로젝트에 2504 명의 파일이 있고 채우기 기준으로 필터링하려고합니다. 나는 (ACB) 최초의 인구에 대해 다음 한 :Plink로 개인 추출. 오류 : --keep 파일의 줄 1에 예상보다 적은 수의 토큰이 있습니다.

plink --file all1000gen --keep indACB.txt --make-bed --out all1000genACB 

하지만 다음과 같은 오류 다시 제공합니다

Error: Line 1 of --keep file has fewer tokens than expected. 

내 indACB.txt 파일은 다음과 같다 :

head indACB.txt 
HG01879 
HG01880 
HG01882 
HG01883 
HG01885 
HG01886 
HG01889 
HG01890 
HG01894 
HG01896 

을 개별 게놈 ID의 2 배 (첫 번째 두 열)와 인구 이름이있는 1000 게놈 페이지에서 사용할 수있는 인구 정보 파일에서 (각 인구, gre를 사용하여) 만든 표시 :

head indpop2.txt 
HG00096 HG00096 GBR 
HG00097 HG00097 GBR 
HG00099 HG00099 GBR 
HG00100 HG00100 GBR 
HG00101 HG00101 GBR 
HG00102 HG00102 GBR 
HG00103 HG00103 GBR 
HG00105 HG00105 GBR 
HG00106 HG00106 GBR 
HG00107 HG00107 GBR 

나는 나의 --keep 파일에 문제가 있다고 생각하지만, 나는 txt 파일의 원하는 구조 무엇 확실하지 않다.

또한 indpop2.txt에서 ACB 개인 greping 시도, 그래서 새로운 indACB.txt 파일은 다음과 같다 :

head indACB2.txt 
HG01879 HG01879 ACB 
HG01880 HG01880 ACB 
HG01882 HG01882 ACB 
HG01883 HG01883 ACB 
HG01885 HG01885 ACB 
HG01886 HG01886 ACB 
HG01889 HG01889 ACB 
HG01890 HG01890 ACB 
HG01894 HG01894 ACB 
HG01896 HG01896 ACB 

을하지만, 다음과 같은 오류 산출 :

plink --file allconcat39 --keep indACB2.txt --make-bed --out allconcat43ACB 

Error: No people remaining after --keep. 

답변

0

처음 두를 열은 가족 및 개별 ID입니다. 세 번째 열은 숫자 값이 될 것으로 예상되지만 파일에 3 열 이상을 포함 할 수 있습니다.이 값이 1 인 개인 만 이후의 분석 또는 파일 생성 절차에 포함됩니다.