31
tidyr의 설명서에 따르면 수집 및 확산은 추이 적이지만 "iris"데이터를 사용한 다음 예제에서는 그럴 수는 없지만 그 이유는 분명하지 않습니다. 모든 설명은 크게 중복 식별자가있는 data.frame/tibble을 사용하여 확산
iris.df = as.data.frame(iris)
long.iris.df = iris.df %>% gather(key = feature.measure, value = size, -Species)
w.iris.df = long.iris.df %>% spread(key = feature.measure, value = size, -Species)
나는 "iris.df"와 동일하게 데이터 프레임 "w.iris.df"을 기대하지만, 대신에 다음과 같은 오류가 발생
주시면 감사하겠습니다 :
"Error: Duplicate identifiers for rows (1, 2, 3, 4, 5, 6, 7, 8, 9..."
내 일반적인 질문은 이러한 종류의 데이터 집합에서 "수집"응용 프로그램을 역전시키는 방법입니다.
관측치를 고유하게 식별 할 수있는 변수가 충분하지 않기 때문에 과도하지 않습니다. 'iris.df $ row <- 1 : nrow (iris.df) '와 같은 것을 추가해보십시오. – hadley
대단히 고마워요! 내 오해를 완벽하게 수정합니다. –