데이터를 병합하는 방식으로 구성된 데이터 프레임이 거대한 목록입니다. 기본적으로 .xls 파일의 가치가있는 중첩 된 디렉토리를 많이 읽었으므로 약 5 명마다 가로로 결합해야하며 5 개의 각 그룹을 수직으로 결합해야하는 데이터 프레임 목록이 있습니다.행을 복제하지 않고 데이터 프레임을 병합하지 않고 R
예제를 제공하려고합니다 (단순화를 위해 그룹 크기를 3로 줄임).
df.list[1]:
id Date col1 col2
1 date1 <int> <int>
2 date1 <int> <int>
3 date1 <int> <int>
df.list[2]:
id Date col3 col4
1 date1 <int> <int>
2 date1 <int> <int>
3 date1 <int> <int>
df.list[3]:
id Date col5 col6
1 date1 <int> <int>
2 date1 <int> <int>
3 date1 <int> <int>
는 다음 몇은 ...
df.list[4]:
id Date col1 col2
1 date2 <int> <int>
2 date2 <int> <int>
3 date2 <int> <int>
df.list[5]:
id Date col3 col4
1 date2 <int> <int>
2 date2 <int> <int>
3 date2 <int> <int>
df.list[6]:
id Date col5 col6
1 date2 <int> <int>
2 date2 <int> <int>
3 date2 <int> <int>
다른 샘플이며,이 몇 천 샘플가는 유지합니다. 나는 dplyr에서 bind_rows()를 사용하여 시도 적이 있지만 그 수율 :
이 세상의 종말이 아니라 그것을 할 필요가 같은 파일 크기가 5 배 큰id Date col1 col2 col3 col4 col5 col6
1 date1 <int> <int> NA NA NA NA
2 date1 <int> <int> NA NA NA NA
3 date1 <int> <int> NA NA NA NA
1 date1 NA NA <int> <int> NA NA
2 date1 NA NA <int> <int> NA NA
3 date1 NA NA <int> <int> NA NA
1 date1 NA NA NA NA <int> <int>
2 date1 NA NA NA NA <int> <int>
3 date1 NA NA NA NA <int> <int>
1 date2 <int> <int> NA NA NA NA
2 date2 <int> <int> NA NA NA NA
3 date2 <int> <int> NA NA NA NA
1 date2 NA NA <int> <int> NA NA
2 date2 NA NA <int> <int> NA NA
3 date2 NA NA <int> <int> NA NA
1 date2 NA NA NA NA <int> <int>
2 date2 NA NA NA NA <int> <int>
3 date2 NA NA NA NA <int> <int>
. 이상적으로 데이터는 다음과 같이 구성됩니다.
id Date col1 col2 col3 col4 col5 col6
1 date1 <int> <int> <int> <int> <int> <int>
2 date1 <int> <int> <int> <int> <int> <int>
3 date1 <int> <int> <int> <int> <int> <int>
1 date2 <int> <int> <int> <int> <int> <int>
2 date2 <int> <int> <int> <int> <int> <int>
3 date2 <int> <int> <int> <int> <int> <int>
도움 주셔서 감사합니다.
이 방법이 효과적이라고 생각하지만 너무 많은 메모리가 필요하므로 불행히도 사용할 수 없습니다. – pariscraigm
약간의 수정이 이루어졌습니다. 나는 또한 측정 값으로 그룹화 한 다음 돌연변이 ID를 추가해야 했습니까? 또한 데이터를 청크로 분할해야했습니다. 나는 돌연변이 ID가 무엇인지 모르겠다. – pariscraigm