data.table

    5

    1답변

    재구성 된 데이터 세트에서 문자열을 붙여 넣으려고합니다. 다음과 같이 나는 data.table 패키지를 사용하고 있습니다 : m<-data.frame(x=rep(c("a","b"),20),y=factor(sample(letters,40,replace=T))) DT<-data.table(m) setkey(DT,x) DT[,paste(y,sep=","),

    9

    1답변

    다른 패키지를 사용하여이 작업을 수행 할 수 있음을 알고 있지만 data.table에서 작업하려고합니다 (그룹화 작업이 가장 빠름). df = data.frame(a=c(1,2,2,3)) ddply(df,.(a),summarise,V1=length(a)) 반면 a V1 1: 1 1 2: 2 1 3: 3 1 에 library(data.table

    -1

    2답변

    data.table의 일부 그룹에 대해 여러 개의 열을 반환하려고합니다. 함수를 사용하여 값 목록을 분리하고 각 그룹에 대한 벡터를 계산합니다. 나는 모든 값을 계산하기 위해 관리 나는 기능이 address1, time1, value1 address1, time2, value2 address1, time3, value3 I 그룹 시간 1 - TIME

    1

    2답변

    dput(df) structure(list(Process = c("PROC050D", "PROC051D", "PROC100D", "PROC103D", "PROC104D", "PROC106D", "PROC106D", "PROC110D", "PROC111D", "PROC112D", "PROC113D", "PROC114D", "PROC130D", "PROC

    1

    3답변

    DF1 <- DF[DF$cat == 'A', ] DF2 <- DF[DF$cat == 'B', ] RDF <- rbind(DF1, DF2) 더 간단한 방법이를 표현하는 방법이 있나요 선택과 같은 RDF <- DF[DF$ cat == c('A','B'), ] # Does not work

    3

    1답변

    특정 tak의 데이터 테이블과의 효율적인 교차 결합이 가능한지 궁금합니다. 벡터의 모든 숫자를 다른 모든 숫자와 비교하는 벡터화 된 버전이 있다고 가정 해 보겠습니다. 내가 잘못 아니에요 경우, R에서의 벡터화 버전 somevector <- rnorm(10, 5) sapply(somevector, function(x) { return(x-some

    4

    1답변

    의 레코드 블록에 대한 시퀀스 번호를 생성 나는 (내 기준으로) 상당히 큰 데이터 집합을 가지고 있고 레코드의 블록 시퀀스 번호를 만들려고합니다. plyr 패키지를 사용할 수는 있지만 실행 시간이 매우 느립니다. 아래 코드는 비슷한 크기의 데이터 프레임을 복제합니다. ## simulate an example of the size of a normal dat

    11

    1답변

    그냥 궁금 가입과 같은 a <- data.table(a=c(1,2,3),b=c(3,4,5)) b <- data.table(a=c(1,2),k=c(1,2)) merge(a,b,by="a",all.x=T) 이 잘 작동하지만 내부는 더 큰 데이터와 결합로는 효율적하지 않습니다 다음과 같이 매우 빠르게 실행되지만 위의 내용은 실제로 느립니다. setkey(

    4

    3답변

    아마도 매우 간단한 질문입니다 만, a 및 b 변수를 설정하여 R의 expand.grid에서 data.frame 또는 data.table을 만들 수 있기를 바랍니다. 예 : a=5 경우, b=3은 내가 expand.grid(seq(0,1,by=1/3), seq(0,1,by=1/3), seq(0,1,by=1/3), seq(0,1,by=1/3)) 즉 b가의

    1

    1답변

    더 광범위하게 사용하려고합니다 data.table 및 ITime은 UDT 복제 POSIXlt "DateTime"유형입니다. > strptime("01-04-2012 09:23:45.987364", format="%d-%m-%Y %H:%M:%OS") [1] "2012-04-01 09:23:45.987364" > time = strptime("01-04-2