2017-11-16 6 views
0

저는 CSV 파일에서 제공하는 사이트 목록에 대한 날씨 변수를 출력하는 R 패키지를 사용하고 있습니다. 데이터는 여러 목록을 포함하는 데이터 프레임으로 제공되므로 각 사이트에 하나씩 포함됩니다. 각 사이트의 각 목록에는 9 개의 변수가 포함 된 데이터 프레임 인 해당 사이트의 데이터 인 사이트 이름, 위도, 경도, 고도 및 타일에 대한 정보가 있습니다.여러 목록을 포함하는 중첩 된 데이터 프레임을 유용한 데이터 프레임/티 블로 변환

library(tidyverse) 
if(!require(devtools)){install.package(devtools)} 
devtools::install_github("khufkens/daymetr") 
library(daymetr) 

'my_sites.csv'아래이, 그냥 사이트 이름과 긴 위도 (더 열 머리글이없는 경우, 다음과 같다을 : 그것은 단지 여기에 코드를 실행하여 출력을 살펴보고 아마 최선의 방법 3 열) 총 : I 사이트 남로 9 개 날씨 변수 출력을 결합 찾고 있어요

str(weather_by_site) 

:

Alpha 43.29515 -89.29077 
Delta 44.14667 -121.34722 

weather_by_site<-download_daymet_batch(file_location = '/Users/Jay/Desktop/my_sites.csv', 
         start = 2012, 
         end = 2016, 
         internal = TRUE) 

이 당신처럼 출력이 모습의 더 나은 아이디어를 제공합니다 각 사이트에 대한 전자 및 타일. 목표는이 코드를 600 개 이상의 사이트에서 실행하고 더 깔끔한 데이터 프레임 또는 튜블 형식으로 데이터를 분석 할 수있게하는 것입니다. 따라서 기본적으로 한 사이트에 대해 2012-2016 사이의 데이터를 갖게되며 모든 사이트가 함께 묶입니다. purrr 사용

+0

난 내 자신의 예를 들어 CSV를 절약 할 수 있었다 바탕 화면을 실행하고 실행하지만 포함 된 데이터에 문제가 있으면 download_daymet_batch()는 델타 사이트의 좌표에 대한 오류를 반환합니다. 아래의 나의 대답은 그것이 별도의 데이터 문제라고 가정하고, 여기서 질문은 결과 데이터를 추출/정리하는 방법입니다. – crazybilly

답변

1

, 우리는 각 결과를 통해 루프, 그 dataframe의 말에 다른 변수를 밀어 결과에서 dataframe을 잡아 수 있습니다

library(dplyr) 
library(purrr) 

# write a function to do pull out the data frame 
# then append the other values 
tidyweather <- function(x) { 

    datadf <- pluck(x, "data") 
    datadf$site  <- x[[1]] 
    datadf$lattitude <- x[[2]] 
    datadf$longitude <- x[[3]] 
    datadf$altitude <- x[[4]] 
    datadf$tile  <- x[[5]] 

    return(datadf) 
} 


weather_df <- weather_by_site %>% 
    # run tidyweather() on each result and return one big data frame 
    map_df(tidyweather)