2017-12-27 34 views
-2

나는 csv "유명 인사 사망자"와 "사망 원인"열이 있습니다. 내가 톱 10 사망 원인의 개수를 가지고 ggplot2 차트에서 만들고 싶습니다. CSV에서 날짜를 사용할 때 R로 계산하는 방법이 없습니다. gsplot2를 사용하여 csv에서 톱 10 카운트 R

나는 모양 CSV 가지고 : https://i.imgur.com/WFTpzDE.png

을 그리고 나는 벡터의 모든 원인을 할 필요가 있다고 생각합니다. 하지만 상위 10 위 안에 그룹화하는 방법을 모르겠다.

+1

먼저 당신이 R 데이터 프레임에 CSV의 데이터를 가져와야합니다. [R tag wiki] (https://stackoverflow.com/tags/r/info)에는 많은 초보자 용 자료가 많이 있습니다. * R * 소개로 시작하는 것이 좋겠지 만 여기에서 많은 질문을 찾을 수도 있습니다. "[r] csv'를 검색하면 스택 오버플로가 발생합니다. – Gregor

+2

[좋은 질문을하는 방법] (http://stackoverflow.com/help/how-to-ask) 및 [재현 가능한 예] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example/5963610). 이렇게하면 다른 사람들이 당신을 도울 수있게됩니다. – Jaap

+0

예를 들어 유명인이 특정 나이에 사망 한 횟수를 다른 차트로 보았습니다. 그러나 나는 죽음의 10 대 원인을 만드는 방법을 모른다. – Mateusz

답변

0

내가 기본 R 및 ggplot2에서 제공 한 것과 함께 할 수있는 최선의 것을 만들어 내려고 노력 중이다.

library(ggplot2) 

celeb <- c("Kim Kardashian", "The chubby kid from stand by me", "The bassist from the local Clash cover band", "One of L. Ron Hubbard's polyps", "Frank Zappa", "Dweezil Zappa", "Moonunit Zappa", "Scott Evil") 

death <- c("Gored by rhino", "Eaten by Compies", "Choked on funyun", "Gored by rhino", "Gored by rhino", "Eaten by Compies", "Gored by rhino", "Failed to meet dad's expectations") 




df <- cbind(celeb, death) 
df <- as.data.frame(df) 

내 감각은 죽음의 원인을 순위를 매기거나 바보 같은 것으로 지정하려는 것입니다. 이것은 지나치게 복잡하지만, 나는 당신에게 한 걸음 한걸음 씩 보여줄 것이라고 생각했습니다.

#first get counts of deaths 
deathcounts <- as.data.frame(table(df$death)) 

#next put them in decreasing order 
topfour <- deathcounts[order(deathcounts$Freq, decreasing=T)[1:4],] 

#cool, so rhinos are dangerous mofos. Let's plot these results 
deathplot <- ggplot(topfour, aes(x=Var1, y=Freq)) + geom_bar(stat="identity") 

귀하 하지요은 일반 결과는 다음과 같습니다 enter image description here