2017-09-21 3 views
-1

각 bin에 대해 누적 개수로 데이터를 binned했습니다. 이 예제에서 파일의 처음 두 열은 나중에 ggplot() 함수의 aestetics 변수로 사용될 변수입니다. 다음 열은 두 개의 빈의 값 (Sb, Ss)과 각 행의 수 (정수 Nb, Ns)입니다 (일반적으로 두 개 이상의 빈이 존재할 수 있음).R : 누적 데이터에서 ggplot에 대한 데이터를 긴 형식으로 변환

continent,location,Ns,Ss,Nb,Sb 
Australia,forest,13,191.2,5,420 
Australia,lagoon, 19,150,7,300 
Europe,forest,13,95,10,215 
Europe,lagoon,32,130,17,205 

는 EDT 제가 시와 함께 니켈 ('크기')와 별도로 두 개의 열 ("참조") 두 개의 열 아교 긴 포맷으로 데이터를 용융 할 필요가있다. 즉, 두 개의 새로운 변수가 될 것이다 : "크기"및 안티몬 (Sb, SS (NB), Ns 개의)에서 "카운트"(첫 번째 두 열은 그대로 유지된다)

continent,location,size,counts 
Australia,forest,191.2,13 
Australia,forest,420,5 
Australia,lagoon,150,19 
Australia,lagoon,300,7 
Europe,forest,95,13 
Europe,forest,215,10 
Europe,lagoon,130,21 
Europe,lagoon,205,17 

기능 gather()tidyr 패키지 만 수율로 "키"및 "값"옵션이 있으므로 마지막 4 개의 열의 모든 값을 가져 와서 해당 문자 (이전 변수 이름) Ss, Sb 등으로 하나씩 레이블을 지정할 수 있습니다.

답변

1

솔직히 말해서 실제로 완료되기를 원하지만, dplyr의 spread() 및 gather() 명령을 사용하여 데이터를 와이드에서로 변환 할 수 있습니다. Google이 귀하를 안내해야합니다.