2017-11-23 5 views
-1

로지스틱 회귀 또는 다른 간단한 알고리즘 세트를 적용하려고 시도했지만 비참하게 실패했으며 많은 오류가 발생했습니다. 나는 그럴간단한 데이터 세트에 로지스틱 회귀 적용

dim(data) 
[1] 11580 12 

head(data) 
ReturnJan ReturnFeb ReturnMar ReturnApr ReturnMay ReturnJune 
    1 0.08067797 0.06625000 0.03294118 0.18309859 0.130333952 -0.01764234 
    2 -0.01067989 0.10211539 0.14549595 -0.08442804 -0.327300392 -0.35926605 
    3 0.04774193 0.03598972 0.03970223 -0.16235294 -0.147426982 0.04858934 
    4 -0.07404022 -0.04816956 0.01821862 -0.02467917 -0.006036217 -0.02530364 
    5 -0.03104575 -0.21267723 0.09147609 0.18933823 -0.153846154 -0.10611511 
    6 0.57980016 0.33225225 -0.40546095 -0.06000000 0.060732113 -0.21536106 

오전 12 열은 내가 여기에이

 PositiveDec 
     0 
     0 
     0 
     1 
     1 
     1 

같은 모습을 예측하려고 노력하고있는 사람은 당신이 점점 내 시도

new.data <- data[,-12] #Remove labels' column 

index <- sample(1:nrow(new.data), size = 0.8*nrow(new.data))#Split data 

train.data <- new.data[index,] 

test.data <- new.data[-index,] 

fit.glm <- glm(data[,12]~.,data = data, family = "binomial") 
+2

코드를 실행하여받은 "많은 오류"를 게시 할 수 있습니까? – useR

+0

Model.frame.default에 오류가 있습니다 (수식 = 데이터 $ PositiveDec ~., 데이터 = train.data, : 변수 길이가 다릅니다 ('ReturnJan'에서 발견됨). –

+1

결과 열을 제거하지 마십시오. 데이터 $ PositiveDec = factor (데이터 $ PositiveDec); train.data = 데이터 [인덱스,]; fit.glm = glm (PositiveDec ~., data = train.data, family = binomial)'. – eipi10

답변

0

이지만, 여러가 문법 오류를 포함하고 주석에서 지적한대로 결과 변수를 그대로 두어야합니다.

index <- sample(1:nrow(data), size = 0.8 * nrow(data)) 
train.data <- data[index, ] 
fit.glm <- glm(PositiveDec ~ ., data = train.data, family = "binomial")