mahout을 사용하여 itemismilarity를 생성하려고합니다. 문제는 출력에서 유사점이 거의 없다는 것입니다. 환경 설정의환경 설정으로 유사 항목 결과를 얻을 수 없습니다 (booleanValue = false)
- 15.910.847 총 수
- 4.047.745 별개의 사용자
- 773.015 별개의 항목 내가 사용자와 prefereces 의 분포를 구축했습니다 : 여기 내 입력 데이터의 특성이다
첫 번째 열은 별개의 사용자의 수이다
두 번째 열은 사용자 당 기본 설정 수입니다. 예를 들어, 하나의 환경 설정 만있는 2.221.760 사용이 있습니다. 여기
내 입력 설정은 다음과 같습니다2221760 1 688258 2 322497 3 192003 4 122446 5 87033 6 63733 7 49556 8 39090 9 31637 10 25634 11
similarityClassname=SIMILARITY_PEARSON_CORRELATION maxSimilaritiesPerItem=100000 minPrefsPerUser=0 booleanData=false threshold=0.75
안녕하세요 :) mahout 사용자 그룹에서 귀하의 답변을 받았습니다. org.apache.mahout.cf.taste.hadoop.similarity.item.ItemSimilarityJob을 사용하고 있는데 숫자 사용자 및 항목 ID를 범위 [0..qtty_of_users], [0..qtty_of_items]에 매핑하기위한 요구 사항을 찾을 수 없습니다. 환경 설정 데이터를 mahout에 넘겨주기 전에 .... org.apache.mahout.cf.taste.hadoop.item.RecommenderJob에 대해서도 마찬가지이다. itemSimilarityMatrix를 얻을 수있는 곳은 – Sergey
이다. 이것을 설명하는 wiki 페이지를 작성하겠습니다. 우리는 방금 0.9 릴리스 용 Wiki를 다시 작성 했으므로 놓친 것입니다. – pferrel
위대한, 시도하고보고하려고합니다. – Sergey