빈 누락 값과 NA가 모두 포함 된 큰 데이터 프레임이 있습니다. 수행 요약 (계수 (안양 $의 COL))는 나에게 A
123
B
50000
90000
C
26000
NA's
12476
같은 (50000 후 빈을 확인할 수 있습니다.) 및 sum(is.na(df$col))은 12476, NA의 수와 동일한 수 있습니다 's의,하지만 난'
R의 팩터의 레벨과 라벨 사이에는 차이가있는 것 같습니다. 지금까지는 항상 레벨이 팩터 레벨의 '실제'이름이고 라벨은 출력에 사용되는 이름 (예 : 테이블 및 플롯). 이 아무튼 df <- data.frame(v=c(1,2,3),f=c('a','b','c'))
str(df)
'data.frame': 3 obs. of 2 variables:
$ v: n
가능한 복제를 (as.numeric은() 작동하지 않는 것) 다음 약 R - How to convert a factor to an integer\numeric in R without a loss of information 다음 사실. 내가 레벨 4, 8, 1 요인을 변환 할 때 숫자() 함수는 내 관심 > blah<-c("4","8","10","15")
기존 행렬 m의 특정 원소 (index)에 변수 f을 쓰고 싶습니다. f <- factor(c(3,3,0,3,0))
m <- matrix(NA, 10, 1)
index <- c(1,4,5,8,9)
m[index] <- f
이 m에 ('2'를 '1'등)가 레이블을 그리 듯 원하는 결과를 제공하지 않습니다 사용하지만 원래 값 (:의는 f 가정하자 요
다음 예제 코드를 사용하여 실제 데이터 집합에 대한 아이디어를 얻었습니다. 나는 2 개의 데이터 세트, factor 변수 List과 논리 변수 ok을 가지고있다. df1 <- c("a","b","c","d","e","f","g")
df2 <- c("a","d","e")
List <- factor(as.integer(df1 %in% df2))
ok <-
큰 숫자가 있습니다. data.frame (1.9M 레코드, 20 개 열)입니다. 열 중 하나는 길이가 다른 숫자 값을 가진 요소 열입니다 (문자/숫자의 다른 수, 예 : 567839, 234324324, 3243211 등). 참고 : 이들은 숫자 코드이며 실제 값이 아니며 이 예에서는 길이가 다릅니다. 는 지금은 요소 요소가 이전 가도록하는 방식으로 13
에서 제외하십시오. 나는 22,000 개의 값을 가진 데이터 세트를 가지고 있고, 적절한 방법으로 그들을 보여주고 싶다. (나의 데이터와 함께 :이 강에서 y 축에 잡힌 물고기 종을 가진 모든 강에 대한 그래프와 x에있는 종마다 붙잡힌 물고기의 수 시킴으로써 행한다. dat<-file[file$RiverName=="Mississippi",]
boxplo
저는 R에 상당히 익숙합니다. 주파수 테이블을 만들려고합니다. 내가 데이터 X<-c(1,2,3,4,3,9, 20)
을 말해봐 그리고 그것이 내가 R과 함께 일을하려고 한 원하는 모든 빈 셀 지금 (factor(X, levels = c(0:max(X))))
을 표시하도록 주파수 테이블을 만들고 싶어 , 그것을 그룹화하여 레벨이 사실 0, 1,2,3,4
내 데이터 프레임을 실제 누락 값으로 변환하지 않고 gplot2에 boxplot에 빈 레벨을 표시하도록 요청하는 방법을 찾을 수 없습니다. # fake data
dftest <- expand.grid(time=1:10,measure=1:50)
dftest$value <- rnorm(dim(dftest)[1],3+0.1*dftest$time,1)
#