나는 약 255 만 개의 행을 가진 data.table
테이블이 있습니다. 두 개의 열이 있습니다. 두 열 모두에서 복제 된 행을 제거하고 싶습니다. 이전에는 data.frame에서 이렇게했을 것입니다 : df -> unique(df[,c('V1', 'V2')])
그러나 이것은 data.table에서 작동하지 않습니다. unique(df[,c(V1,V2), with=FALSE])
시도했지만 여전히 경우에만 키를 data.table 및 전체 행을 작동하는 것 같다.data.table에서 중복/비 고유 행 필터링
제안 사항?
건배 데비 V2
테이블 키 행만 -4,7-이고, (10)이 제거 될 수있는 상기 data.table
예
>dt
V1 V2
[1,] A B
[2,] A C
[3,] A D
[4,] A B
[5,] B A
[6,] C D
[7,] C D
[8,] E F
[9,] G G
[10,] A B
.
> dput(dt)
structure(list(V1 = c("B", "A", "A", "A", "A", "A", "C", "C",
"E", "G"), V2 = c("A", "B", "B", "B", "C", "D", "D", "D", "F",
"G")), .Names = c("V1", "V2"), row.names = c(NA, -10L), class = c("data.table",
"data.frame"), .internal.selfref = <pointer: 0x7fb4c4804578>, sorted = "V2")
는 [.N은 = (V1, V2)에 의해.] [1 : 2]' – Akki