1

기계 학습 접근법을 사용하여 콘텐츠 기반 추천 시스템을 개발하고 싶습니다. SVM/신경망/KNN 분류기를 사용할 계획입니다. 300 명의 사용자로부터 데이터를 수집했습니다. 이는 사용자 관심 모델링 문제로 볼 수도 있습니다.기계 학습을 사용하는 콘텐츠 기반 추천 시스템에서 몇 개의 분류자를 필요로합니까?

다음과 같은 의문의 여지가 있습니다.

  1. 개별적으로 분류자를 훈련해야합니까 ?? 이것은 확장 성이없는 것 같습니다.

  2. 그렇다면 최종 평가 결과를 어떻게 표시합니까 ?? 정밀도/각 사용자에 대해 별도로 리콜 ??

감사합니다, Atish는

답변

0

아니,이 신경 네트워크의 모든 사용자에서 작동하고 싶다.

내가해야 할 일은 데이터 세트를 모든 사용자에게 교육 및 테스트 세트로 분할하는 것입니다. 시험을 치워두고 신경망을 훈련 시키십시오.

좋은 모델이 있다고 생각되면 테스트 세트를 실행하고 성공률을 확인하십시오.

초과 장착에주의하십시오. 당신의 훈련 세트가 너무 잘 예측된다면, 당신은 지나치게 맞지 않을지도 모른다. 테스트 세트의 결과가 좋지 않을 때 표시됩니다.

필요한 성공 정도를 결정해야합니다. 당신의 신경망이 80 % 예언이라면, 그것으로 충분합니까? 90 %? 95 %? 시작하기 전에 그것을 알아 내야합니다.

부트 스트랩에 대해 읽어야합니다.

+0

감사합니다 @duffymo 나는 그것을 할 것입니다. 사용자 분류 기준이 필요한 경우가 있습니까 ?? 이 질문을하는 이유는 그것이 추천 시스템 책 중 하나에 쓰여졌 기 때문입니다. – alex

+0

사용자 별 분류 기준은 사용자간에 적용하려는 경우 의미가 없습니다. 너는 공통적 인 특징을 찾고 있잖아. 그렇지? Netflix는 귀하와 같은 모든 사용자의 데이터를 사용하므로 사용자간에 특성에 따라 결정합니다. "Collective Intelligence 프로그래밍"을 읽어야합니다. 그것은 추천 시스템에 대한 훌륭한 장을 가지고 있습니다. – duffymo