2017-04-15 6 views
0

저는 R에 익숙하며 dataframe의 기존 열 (총 추가 정보)의 값 중 median을 나타내는 새 열을 포함하는 새 데이터 세트를 dataframe에서 원합니다. 후자는 약 5,000 개의 개별 관찰로 구성됩니다. 속성, 월, 년과 현재 시장R을 사용하여 기존 데이터 프레임에있는 열의 중앙값을 사용하여 새 데이터 세트를 만드는 방법은 무엇입니까?

다음과 같이 서, 내 dataframe (의이 mydata1를 부르 자) : 나는 중간의 필요성은 다음과 같은 기준에 따라 계산하는대로이 작업을 수행하는 방법에 조금 혼란 스러워요 (처음 5 행 표시) :

Property Date  Month Year  Market TotalExtras 
ZIL   1-Jan-15 1 2015  UK   450.00 
ZIL   1-Jan-15 1 2015  UK   125.00 
ZIL   1-Feb-15 2 2015  UK   300.00 
ZIL   1-Feb-16 2 2016  FR   225.00 
EBA   1-Feb-15 2 2015  UK   150.00 
... 

내가 만들 내 R 코드를 필요로 새로운 dataframe 아래와 같이 나타납니다 (의이 mydata2라는 부르 자) : 위의

Property  Date  Month Year  Market MedianTotalExtras 
    ZIL   1-Jan-15  1 2015  UK   175.00 
    ZIL   1-Feb-15  2 2015  UK   250.00 
    ZIL   1-Feb-16  2 2016  FR   400.00 
    EBA   1-Feb-15  2 2015  UK   328.00 
    ... 

그림은 그림 purpo에 대한 있습니다 단지 ses. 기본적으로 mydata2는 mydata1의 'TotalExtras'열을 대체하는 '중간 값 총액'열과 함께 속성, 날짜 및 시장을 기반으로 데이터를 다시 그룹화합니다.

R?

group_by 고유 Property, Date, Market 콤보 조각으로 데이터 세트의 가입 절단 배치
mydata1 %>% 
    group_by(Property, Date, Market) %>% 
    summarise(MedianTotalExtras = median(TotalExtras)) 

summarise + median 중앙값을 계산한다

+0

당신의 질문이 R *으로 할 수 있다면, 안심할 수있는 것보다 ... :) –

답변

0

dplyr의 일반 요지는 무엇인가를 할 것이다.

+0

고마워, 정확히 내가 필요로하는 것. – user3115933