1500 개의 관측치와 130 개의 변수가있는 dt.train2 데이터 세트가 있습니다. 그 중 하나는 languages이며 내가 속성 english에 대한 1, 2french를 들어, 3spanish과 다른 것을위한 0 제공하는 ifelse 문자열을 만들 english, french, arabic ... 수 있습니다. 나는 그것을 어떻게하는지 모른다. d
내가 가진 df 같은 : 나도 같은 chr 및 strand을 공유하고 유사한 시작이 그 행을 가입하려는 SampleID Chr Start End Strand Value
1: rep1 1 11001 12000 - 10
2: rep1 1 15000 20100 - 5
3: rep2 1 11070 12050 - 1
4: rep3 1 149
큰 텍스트 파일 (475,000,000 줄)이 있습니다. 나는 그것을 읽지 않고 파일의 행 수를 빨리 얻고 싶다. 이 행 번호를 추출하는 방법은 전체를 읽지 않고 있습니까 fread('D:/text_file.txt',select=1,colClasses="character")
Read 7.1% of 472933221 rows #number of rows a
가있어 두 개의 샘플 데이터 세트 : > aDT
col1 col2 ExtractDate
1: 1 A 2017-01-01
2: 1 A 2016-01-01
3: 2 B 2015-01-01
4: 2 B 2014-01-01
> bDT
col1 col2 date_pol Value
1: 1 A 2017-05-20 1
2: 1 A 201
필자가 작성한 패키지에서 data.tables를 백본으로 사용하려고합니다. 내가 :: 모든 시간을 사용 (그리고 [ 및 := 사업자와 합병증을 피하기)하지 않기 때문에, 나는 모든 DT를 사용할 수 있도록 설명에 가져 오기로 따라 달라 data.table하지 포함 기능을 직접적으로. 나는 패키지 다 잘하지만,이 (DTTest.Rcheck/00install.
에 다른 데이터 테이블과 목록의 모든 요소를 병합하는 방법은 다음과 같은 데이터가 있습니다 library(data.table)
dt1 <- data.table(var1 = c("wk1","wk1","wk2"),
var2 = c(1,2,3))
dt2 <- data.table(var3 = c("a","b","c"),
이것은 이전 질문 인 후속 조치 here입니다. : dt_constraints <- data.table(columns=c("t1","t3","t7","t8"), operator=c(rep(">=",2),rep("<=",2)),
values=c(-.6,-.5,2.4,.5))
columns operator values
1 t1
나는이 문제에 대해 data.table을 사용하고있어 매우 큰 데이터 프레임 (30 ~ 50 만 건의 레코드가 있음)이 있습니다. 나는 data.table보다 dplyr에 훨씬 더 익숙하다. 다음의 작은 예를 생각해 봅시다. 실제 데이터 세트에는 더 많은 열이 있습니다. library(data.table)
library(magrittr)
library(
Field1, Field2 및 Value의 3 개 열이있는 데이터 테이블이 있습니다. Field2의 각 속성에 대해 값의 최대 합계에 해당하는 Field1의 특성을 찾고 싶습니다 (즉, 데이터 테이블에 여러 개의 Field1/Field2 행이 있음). 내가 이것을 시도 할 때 : x[,.(Field1 = Field1[which.max(sum(Value))]