추천 시스템에 필요한 데이터의 양은 어느 정도입니까?

저는 HR 부서의 성격/직무 적합성 온라인 테스트를 개발해야합니다. 기본적으로 사용자는 예를 들어 0-10의 척도로 질문에 답변하고, 50 개의 질문을 한 후에 5 가지 성격/직무 적합성의 등급으로 번역하고 싶습니다.추천 시스템에 필요한 데이터의 양은 어느 정도입니까?

처음에는 실제 데이터가 없으므로 먼저 MyMediaLite (github)와 같은 권장 엔진을 사용하는 것이 좋습니다. 적절한 성능을 내기 위해 샘플을 몇 개 준비해야합니까?

이전에 각 질문이 해당 질문과 관련된 여러 코스의 가중치를 늘린 손 가중 합계를 사용하여 교육 과정 권장 사항을 작성했습니다. 이 시스템은 피드 - 포워드 뉴럴 네트워크처럼 구축 된 전문가 시스템으로, 질문 및 강의 내용에 대한 지식을 바탕으로 모든 가중치를 개인적으로 조정했습니다.

이번에는 추천 시스템을 사용하고 싶습니다만, 50 번 질문 테스트를 몇 번이나하고 나서 수동으로 결과를 할당해야하는지 궁금합니다. 100 가지 예가 할 수 있을까요? 가능할 수 있습니다. 1000은 너무 길다. 사전에 어떻게 알 수 있습니까?

출처

2013-08-12 AwokeKnowing

쓸모는 없지만 확실한 숫자를 부여하는 것은 불가능합니다. 새로운 샘플을 추가 할 때 학습 곡선에 중점을 두어야합니다.

샘플을 손으로 처리하고 병렬로 엔진을 처리하고 둘 모두에 의해 주어진 결과를 비교할 수 있습니다. 예를 들어, 엔진에 의해 주어진 결과의 리콜 및 정밀도가 당신의 기대를 달성한다면, 당신은 충분한 샘플을 얻을 수 있습니다.

호프이 도움이 되길 바랍니다.

출처

2013-08-19 05:25:37 charmpeach

감사합니다. 모호한 질문이었습니다. 누군가가 비슷한 것을했을 수도 있고 매개 변수의 수가 필요한 샘플의 수와 어떤 관련이 있는지 알 수있었습니다. – AwokeKnowing

추천 시스템에 필요한 데이터의 양은 어느 정도입니까?

답변

관련 문제