2014-11-17 5 views
1

weka을 사용하여 추천 시스템을 만드는 중입니다. 지금까지 인터넷에서 데이터 세트에 대해 읽은 내용은 입니다. 추천을 받기 위해서는 더 많은 데이터가 있어야합니다. 나는 많은 양의 데이터를 가질 수없는 것에 대해 어떤 것을 추천하려고한다면 어떨까? 예를 들어 특정 도시에 대해 공원 또는 병원 권장 시스템을 생성하려는 경우. 100 개 이상의 항목이 없습니다. 그렇다면 작은 데이터 세트으로 처리해도 괜찮습니까?추천 알고리즘의 데이터 집합 크기

+0

데이터 집합에 몇 개의 특성이 포함될 예정입니까? 복잡한 문제입니까? 더 이상의 정보없이 말하기는 어렵습니다. –

+0

작은 데이터 세트 (예 : 100)로 학습하면 추천 시스템이 작동하지만 정확도가 1000 데이터 세트만큼 좋지 않을 수 있습니다. –

+0

@MatthewSpencer에는 5-7 개의 속성이 있습니다. – user3297557

답변

1

this post에보고 된 것처럼 모델에 충분한 데이터를 준비하는 데 사용할 수있는 가이드 또는 규칙이 있습니다. 여기에 조언 중 일부는 포함 : 클래스 당 기능의 학습 사례와 같은 기능의

  • 적어도 6 배 수
  • 적어도 세 번 수는

다음은 규칙이 있습니다 데이터의 복잡성에 따라 충분하지 않을 수도 있습니다. 이 기사에 요약 된 권장 사항을 토대로 100 건의 사례만으로 충분할 수 있지만 Ramanan R이 명시한대로 더 많은 사례가 더 나을 수 있습니다.

희망이 도움이됩니다!