분산 mahout recommender 작업 org.apache.mahout.cf.taste.hadoop.item.RecommenderJob
어떻게 중복 및 triplicate 사용자 항목 항목이 존재하지만 다른 환경 설정 값을 가진 CSV 파일을 처리 궁금 해서요. 내가
1,2,0.3
1,3,0.7
1,3,-0.7
중복 사용자, 항목 enteries 있지만 다른 환경 설정 값을 가진 Mahout Datamodel
1,1,0.7
1,2,0.7
같은 항목을했다 .csv 파일이 있다면 예를 들어, 어떻게 두싯의 데이터 모델은이 문제를 해결할 것인가? 주어진 사용자, 항목 입력 (예 : 사용자 항목 1,2의 경우 기본 설정이 (0.7 + 0.3))에 대한 기본 설정 값을 요약하거나 값을 평균화합니까 (예 : 사용자 항목 1,2의 기본 설정은 (0.7 + 0.3)/2) 또는 감지 한 항목 항목 (예 : 사용자 1,2의 경우 기본 설정 값은 0.3으로 설정)에 대한 최종 사용자 기본값이 기본값입니다.
여러 환경 설정 메트릭 (항목보기, 좋아요, 싫어요, 장바구니에 저장 등)을 기반으로 권장 사항을 검토 중이므로이 질문을드립니다. 데이터 모델이 선호도 값을 선형 가중치 (예 : 항목보기 및 희망 사항에 저장하는 것이 항목보기보다 선호도 점수가 높음)로 처리하면 도움이됩니다. 데이터 모델이 이미 합산하여 처리하는 경우 추가 map-reduce를 사용하면 여러 메트릭을 기준으로 총 점수를 정렬하고 계산할 수 있습니다. 누구든지 mahout .csv 데이터 모델에서 제공 할 수있는 명확한 설명은이 점에서 org.apache.mahout.cf.taste.hadoop.item.RecommenderJob
에 대한 것이므로 정말로 감사하겠습니다. 감사.
이 수단은 K R 알고리즘의 구현을 사용하여 해결 될 수있는 것 같다. 정보를 공유하고 싶었습니다. – Swamy