missing-data

    1

    1답변

    R 및 임의의 포리스트 패키지를 범주 형 및 숫자 형 변수와 "원치 않는 coloumns"가 포함 된 데이터 집합으로 사용하려고합니다. 내 예측 변수로 포함시키지 않으려는 coloumns). 또한, 내 바람직한 변수 중 일부 (예측 변수로 사용되기로되어 있음)가 누락되었습니다. 어떻게 처리 할 수 ​​있습니까?

    2

    3답변

    내가 누락 된 데이터를 많이 가지고 dataframe가 있다고 가정 할 수있는 가장 완벽한 행을 유지 나는 새로운 dataframe를 만들 id q1 q2 q3 0 a 1.0 low NaN 1 a 1.0 NaN 1.0 2 b NaN NaN NaN 3 b NaN high 1.0 4 b 0.0 low 0.0 5 c NaN high 0.0 6 d 1

    0

    2답변

    신호가 손실 된 누락 값의 누락을 포함하는 일련의 시계열 데이터 (특히 GPS 속도 데이터)가 있습니다. 짧은 지속 시간의 누락 된 기간에 대해서는 간단히 na.spline을 사용하여 채울 예정이지만, 더 긴 기간에는 부적합합니다. 미리 정의 된 가속 한계를 기준으로 마지막 실제 값을 0으로 낮추고 싶습니다. #create sample data frame

    1

    1답변

    나는 임의의 숲을 배우고있다. 학습 목적으로 다음 링크 random Forest을 사용하고 있습니다. 내 R-3.4.1을 사용하여이 링크에 제공된 코드를 실행하려고합니다. 하지만 코드 &이 imp2 <- impute(test,target = "target",classes = list(integer=imputeMedian(), factor=imputeMode

    1

    1답변

    데이터 세트에 약 40 %의 누락 값이 있습니다. 그래서 e1071 패키지의 impute()을 사용했습니다. 정수 변수의 누락 된 값을 중앙값으로 보냄으로써 다음 코드를 사용했으며, 문자 변수의 값은 해당 모드로 누락되었습니다. library(mlr) imp1 <- impute(obj = as.data.frame(train_prop), target=cha

    3

    1답변

    Frame<int,string>의 DeedleDataFrame에는 누락 된 값이 있습니다. 누락 된 값을 빈 문자열 ""으로 변환하고 싶습니다. valueOr 함수를 사용하려고했지만 도움이되지 않았습니다. 이것을 할 수있는 방법이 있습니까? 여기 내 DataFrame입니다 : FSI에 df;;를 입력하면 let s1 = Series.ofOptionalObs

    0

    2답변

    I 한 달 동안 데이터 프레임이 있습니다 (APRIL 1 - APRIL 30). 시간별로 수집 된 데이터입니다. plotNA.distribution을 사용하여 times series plot을 만들고 싶습니다. 문제는, 내 이름 (헤더)을 시계 (00.00 - 23.00)로 설정하는 방법입니까? 0 1 2 3 4 5 6 7 2017년 1월 4일 24

    0

    1답변

    저는 node.js와 API를 처리하는 방법을 처음 사용합니다. 나는 물건을 많이 가진 큰 배열로 가정되는 buy.listings이 { total: 1, skip: 0, page_size: 10, buy: { total: 1, listings: [ [Object] ], fold: false }, sell: [] }

    0

    2답변

    값이 누락 된 경우 R의 가중 평균을 계산할 수 있고 값이 누락 된 경우 기존 값의 가중치가 그에 비례하여 상향 조정됩니까? 이 사실을 명확하게 전달하기 위해 가상 시나리오를 만들었습니다. 이것은 누락 된 값에 따라 각 행에 대해 스칼라를 조정해야하는 질문의 루트를 설명합니다. Image: Weighted Mean Calculation File: Weigh

    0

    1답변

    불완전한 데이터 프레임이있어서 그룹과 일치하는 누락 된 값을 채우고 싶습니다. 숫자 값으로 incomplete_table <- tibble(id = c(1,1,2,2,3,3,3), value = c("a",NA,"b","b","c","d", NA)) # # A tibble: 7 x 2 # id value # <dbl> <chr>