데이터 테이블 "the.data"가 있는데 첫 번째 열은 측정 장비를 나타내고 나머지는 다른 측정 데이터를 나타냅니다. 예를 들어 제 1 군 (G1) 용 장치 (1)를 참조하여 2 g1 <- c(1,2)
g2 <- c(4,3,1)
g3 <- c(1,5,2)
g4 <- c(2,4)
g5 <- c(5,3,1,2,6)
groups <- c("g1","g
R 패키지에 관한 질문 data.table : 메모리 효율적인 방법으로 여러 data.table 열을 제거하는 방법은 무엇입니까? 삭제할 열 이름이 벡터 deleteCol에 저장된다고 가정하십시오. DT[, deleteCol, with=FALSE] <- list()
을하지만이 unused argument(s) (with = FALSE) 감사를 주었다 d
큰 data.table의 열 클래스를 결정하고 싶습니다. colClasses <- sapply(DT, FUN=function(x)class(x)[1])
작품,하지만 분명히 로컬 복사본은 메모리에 저장됩니다 "FALSE =와"는 data.table 항상 data.table 결과 때문에 > memory.size()
[1] 687.59
> colClass
데이터 프레임의 행들의 그룹들을 결합하는 방법 고투 그래서 product_id view_count purchase_count
1 11 1
2 20 3
3 5 2
...
I가 VIEW_COUNT 의해 단체가 간격 대한 purchase_count를 요약 테이블에이 변환하고자 예. view_count_range total_purc
데이터 표를 사용하면 선택한 열에서 통계를 "스윕"하는 가장 빠른 방법일까요? (의 상당히 큰 버전) DT p <- 3
DT <- data.table(id=c("A","B","C"),x1=c(10,20,30),x2=c(20,30,10))
DT.totals <- DT[, list(id,total = x1+x2) ]
시작 나는 목표 컬럼 (2 : p)를
다른 열의 데이터가 들어있는 data.table에 새 열을 추가하고 싶습니다. 그러나 열의 선택은 다른 열의 내용에 따라 행마다 다릅니다. 그래서 : 데이터 세트에 대한 : 나는 (행 당)를 포함, '선택'새 열, 하나의 데이터로부터 싶습니다 dat=data.table(a_data = c(55, 56, 57),
b_data = c(1, 2,
다른 항목의 해당 항목이 동일한 항목이있는 항목의 평균을 취하는 방법은 무엇입니까? 예를 들어 나는 3 열, 시간 및 가격이 2 인 대형 테이블을 가지고 있으며 시간 열 아래에서 값이 반복된다고 말할 수 있습니다. 10:30처럼 4 번 나타나면 해당 가격 열 항목의 평균을 취하여 단일 가격으로 10:30의 단일 행으로 요약해야합니다. 누군가 나에게 통찰력을
큰 R 데이터 프레임의 모든 행에 대해 계산 최적화하는 방법 : 모든 고유 한 이름/일 쌍에 대해 name day wages
1 Ann 1 100
2 Ann 1 150
3 Ann 2 200
4 Ann 3 150
5 Bob 1 100
6 Bob 1 200
7 Bob 1 150
8 Bob 2 100
을, 나는을 계산하고 싶습니다 '이 사람의
다음과 비슷한 데이터 프레임이 있습니다. 일부 개인은 특정 변수에 대해 둘 이상의 관찰을 가지며 각 변수에는 추정치와 관련된 표준 오차 (SE)가 있습니다. 각 개인에 대해 하나의 행만 포함하는 새로운 데이터 프레임을 만들고 싶습니다. Kim이나 Bob과 같이 하나 이상의 관찰이있는 개인의 경우, 새로 계산 된 가중 평균에 대한 분산과 함께 추정치의 표준
내 데이터는 중대형 경향이 있지만 "BIG"데이터로는 적합하지 않습니다. 데이터는 거의 항상 복잡하게 관계형입니다. 여기서는 총 크기가 1-10GB 인 10-50 개의 테이블에 대해 설명합니다. 아무것도 더. 이보다 더 큰 데이터를 다룰 때 Postgres 또는 SQL Server에 사용합니다. 전반적으로 SQLite를 좋아하지만, 함께 작업하는 데이터에는