저는 R에 익숙하며 dataframe
의 기존 열 (총 추가 정보)의 값 중 median
을 나타내는 새 열을 포함하는 새 데이터 세트를 dataframe
에서 원합니다. 후자는 약 5,000 개의 개별 관찰로 구성됩니다. 속성, 월, 년과 현재 시장R을 사용하여 기존 데이터 프레임에있는 열의 중앙값을 사용하여 새 데이터 세트를 만드는 방법은 무엇입니까?
다음과 같이 서, 내 dataframe
(의이 mydata1를 부르 자) : 나는 중간의 필요성은 다음과 같은 기준에 따라 계산하는대로이 작업을 수행하는 방법에 조금 혼란 스러워요 (처음 5 행 표시) :
Property Date Month Year Market TotalExtras
ZIL 1-Jan-15 1 2015 UK 450.00
ZIL 1-Jan-15 1 2015 UK 125.00
ZIL 1-Feb-15 2 2015 UK 300.00
ZIL 1-Feb-16 2 2016 FR 225.00
EBA 1-Feb-15 2 2015 UK 150.00
...
내가 만들 내 R 코드를 필요로 새로운 dataframe
아래와 같이 나타납니다 (의이 mydata2라는 부르 자) : 위의
Property Date Month Year Market MedianTotalExtras
ZIL 1-Jan-15 1 2015 UK 175.00
ZIL 1-Feb-15 2 2015 UK 250.00
ZIL 1-Feb-16 2 2016 FR 400.00
EBA 1-Feb-15 2 2015 UK 328.00
...
그림은 그림 purpo에 대한 있습니다 단지 ses. 기본적으로 mydata2는 mydata1의 'TotalExtras'열을 대체하는 '중간 값 총액'열과 함께 속성, 날짜 및 시장을 기반으로 데이터를 다시 그룹화합니다.
R?
group_by
고유
Property
,
Date
,
Market
콤보 조각으로 데이터 세트의 가입 절단 배치
mydata1 %>%
group_by(Property, Date, Market) %>%
summarise(MedianTotalExtras = median(TotalExtras))
및 summarise
+ median
중앙값을 계산한다
당신의 질문이 R *으로 할 수 있다면, 안심할 수있는 것보다 ... :) –