2017-12-29 13 views
2

여러 개의 노트가있는 독립 변수와없는 변수가있는 다 변수 스플라인 모델을 코딩하려고합니다. 스플라인 변수는 항상 1의 차수를가집니다. 나는 약간의 코드를 가지고있다. 그러나 나는 그것을 신뢰할 수 있는지 모르겠다. 왜냐하면 나는 (몇몇 독점적 인 "블랙 박스"소프트웨어에서만) r에서 스플라인 회귀를하지 않았기 때문이다. 아래는 코드입니다.각도가 1 인 스플라인 모델을 다른 노트로 어떻게 코딩합니까?

나는 스플라인에서 6,000 개의 게시물을 많이 확인했습니다. 나는 혼란스럽게 많은 다른 코드들을 보았다.

누구나 )이 코드가 내가 원하는대로하고 있는지 말해 주시겠습니까? (degree = 1/different knots) b) 더 좋은 방법이 있습니까?

fit1 <- glm(freq ~ channel + term2 + pay_plan_bucket_2 + 
      state + eff_year + marital_status + 
      vehicle_type + insured_age_bucket + I(pmax(0, insured_age_bucket- 
26)) + I(pmax(0, insured_age_bucket - 70)) + 
      vehicle_length_bucket + I(pmax(0, vehicle_length_bucket - 45)) + 
      veh_age + I(pmax(veh_age -7)) + I(pmax(veh_age - 18)) + 
      rba_bucket + I(pmax(0, rba_bucket - 3500)) + I(pmax(0, rba_bucket - 27000)) + 
      credit_tier_bucket + I(pmax(0, credit_tier_bucket - 3)), 
     family=quasipoisson(link="log"), 
     data=comp_training_set_newpayplan) 

감사합니다.

+0

이것은 통계 동반자 CV뿐만 아니라 SO (최소 재현 가능 사례가 없음)의 주제가 될 가능성이 큽니다. 그럼에도 불구하고, 약식 검사는 코드가 정확하다는 것을 나에게 제안합니다. [내 관련 CV 게시물을 참조하십시오] (https://stats.stackexchange.com/questions/225653/periodic-splines-to-fit-periodic-data/319760#319760). – AdamO

+0

나는 이것이 정확하게 스플라인 (또는 매듭)이라고 불릴 수 있다고 생각하지 않습니다. 두 개 이상의 "매듭"을 가지고있을 때 연속적이지 않으며 매듭에서 훨씬 덜 차별화됩니다. –

+0

고마워요. 42. 너는 제안이 있니? – Jordan

답변

1

스플라인에 대한 무차별 접근법이 맞을 수도 있습니다. 수식에서 단일 용어로 bs(credit_tier_bucket, knots=3, degree=1)과 같이 스플라인 패키지의 bs을 사용하여 출력을 확인하십시오. 기초가 다르게 형성 되었기 때문에 두 모형에서 예측 된 값을 모으고 이들이 동일한 지 확인하여 두 개의 스플라인 코딩 방법이 동일한 추정 및 추론을 제공하는지 확인합니다.

+0

@AdamO가 될 것입니다. 당신이 말한대로, 맞는 값은 가깝지만 편안하지 않을만큼 가깝습니다. 패턴이 잘 보이지 않더라도 잔차의 기본 플롯은 패턴이 비슷합니다. 답장을 보내 주셔서 감사합니다. – Jordan

+0

@Jordan 더 간단하고 재현 가능한 예를 위해 소식을 수정할 수 있습니다. 'boot' /'MASS' 패키지의'motor' 데이터 세트는 좋은 패키지입니다. – AdamO