mahout에서 항목 기반 권장 사항을 사용하려고합니다. 그것은 2.5M 사용자, 항목 상호 작용, 환경 설정 값없이 포함되어 있습니다. 약 100 개의 항목과 100,000 명의 사용자가 있습니다. 권장하는 데 약 10 초가 걸립니다. 반면에 동일한 데이터의 경우 사용자 기반 추천기를 사용할 때 1 초도 채 걸리지 않습니다. Mahout의 항목 기반 제안자의 성능 문제
ItemSimilarity sim = new TanimotoCoefficientSimilarity(dm);
CandidateItemsStrategy cis = new SamplingCandidateItemsStrategy(10,10,10,dm.getNumUsers(),dm.getNumItems());
MostSimilarItemsCandidateItemsStrategy mis = new SamplingCandidateItemsStrategy(10,10,10,dm.getNumUsers(),dm.getNumItems());
Recommender ur = new GenericBooleanPrefItemBasedRecommender(dm,sim,cis,mis);
나는 그가 SamplingCandidateItemsStrategy에 대한 위의 매개 변수를 사용하여 제안 @Sean의 대답 중 하나 읽었다. 그러나 나는 그것이 실제로 무엇을하는지 확신하지 못한다.
편집 : 2.5 M이 10 만 사용자가 및 항목의 총 개수가 많은 이유 중 100