2017-11-28 12 views
0

현재 map_df 코드를 사용하여 두 개의 데이터 파일을 병합하려고합니다. 내 데이터 세트 [https://catalog.data.gov/dataset/baby-names-from-social-security-card-applications-national-level-data]]를 다운로드하여 작업 디렉토리의 파일 위치에 배치했습니다. 그것은 작은 별도의 파일이 많은 파일입니다. 코드에서 모든 단일 파일의 이름을 지정하는 대신 map_df를 사용하여 데이터 세트를 신속하게 가져 오기를 희망합니다.read.csv.folder - 한 폴더에서 데이터를 빠르게 가져옵니다.

namedata.df <- read.csv.folder(Namedata, x = TRUE, y = TRUE, header = TRUE, dec = ".", sep = ";", pattern = "csv", addSpec = NULL, back = TRUE) 

내가의 반환받을 : : 그 폴더에서 데이터를 가져하려고 할 때, 객체를 ': SUBSTR의 오류 (폴더 = NCHAR (폴더)) = NCHAR (폴더를 중지 시작) Namedata '을 (를) 찾을 수 없습니다.

왜 폴더가 누락 되었습니까? 데이터 폴더를 가져 오는 더 좋은 방법이 있습니까?

+1

일반적으로 이렇게하는 방법은'list.files()'를 사용하여 파일 이름 목록을 얻은 다음'lapply()'(또는 다른 적용 함수)를 호출하여'read.csv()'를 호출한다. 의사 코드 :'lapply (filenames, read.csv, ...)' – Mako212

+0

@ list.files()에 대한 @ Mako212 +1, 젊은 선수들을위한 함정은'full.names' 매개 변수가'FALSE'입니다. 기본적으로. 이것을'TRUE'로 설정하면'read_csv()'가 파일을 찾을 수 있도록 전체 경로와 파일 이름을 얻을 수 있습니다. –

+0

@Snubian 나는 그 논쟁을 바꾸지 않는 문제가 없었기 때문에 나는 잠시 혼란 스러웠다. 그러나 당신이 작업 디렉토리가 아닌 다른 것에'list.files()'를 실행했다면 관련이 있다고 생각한다. 나는 일반적으로 관련 폴더에'setwd()'를 써서 그 문제를 피한다. – Mako212

답변

0

projectTemplate을 사용해보세요. load.project() 명령을 실행하면 모든 csv, xls 파일을 데이터 프레임으로로드합니다. 데이터 프레임 이름은 파일 이름과 같습니다.