2016-10-11 8 views
0

스태킹 작동 방식을 이해하려고하는데, 지금까지 제대로 이해하는지 잘 모르겠습니다.스태킹, 스택 일반화 알고리즘

  1. 우리는 완전한 데이터 세트로 K 기본 학습자 (레벨 0)의 각을 훈련 : 그래서 여기 내가 지금까지 이해하는 것입니다.

  2. k 기본 학습자가 전체 데이터 세트를 예측하도록했습니다.

  3. 우리는 k 기본 학습자의 모든 예측으로부터 새 데이터 세트를 만듭니다. 새로운 데이터 세트는 원래의 데이터 세트와 각 기본 학습자의 예측과 같습니다.

  4. 이 데이터 세트는 메타 학습자 (레벨 -1)를 훈련시키는 데 사용됩니다.

내 질문 :

  1. 이 지금까지 맞습니까?
  2. 저는 종종 교차 유효성 검사가 스태킹에 사용되는 것을 읽었지 만 알아낼 수 없었습니다. 어떻게 사용됩니까? 아니면 필수적인 부분일까요? 실종 됐나요?

많은 감사

답변

3

이해는 대부분 정확! 에

새로운 데이터 세트는 우리의 원래 데이터 세트 + 각 기본 학습자의 예측과 같습니다.

각 기본 학습자의 원래 기능 + 예측을 사용하지만 수있을 때 그들은 일반적으로 각각의 기본 학습자의 바로 예측을 사용하는 스택에 대해 이야기했습니다.

종종 교차 유효성 검사가 어떻게 든 스태킹에 사용된다는 것을 읽었지 만 사용 방법을 알 수 없었습니다. 아니면 필수적인 부분일까요? 실종 됐나요?

예, 교차 유효성 검사는 스태킹과 함께 사용됩니다. 메타 플랜 (레벨 -1이라고 부름)은 기본 모델이 만든 예측에서 과장 될 수 있습니다. 각 예측은 전체 데이터 세트를 보았을 때 이루어집니다.

그래서 교차 검증을 수행하고 데이터를 k- 폴드로 나눕니다. 보이지 않는 데이터에 대해 모델이 예측할 것으로 예상되는 편향되지 않은 예상치를 얻기 위해 k 번째 보류 아웃 (k 개의 모든 k를 순환)에 대한 예측을 사용합니다. 그런 다음 메타 모델을 해당 모델에 맞 춥니 다 (교차 유효성 검사 없음).