2013-05-13 4 views
2

두싯를 사용하여 추천인을 평가한다. 여기에는 컴퓨팅 권장 사항 (RecommenderJob) 작업이 포함됩니다. Mahout은 또한 이러한 권장 사항을 테스트하는 데 사용할 수있는 다양한 RecommenderEvaluator를 정의하지만 Hadoop을 사용하여 이러한 권장 사항을 분산 방식으로 실행하는 방법은 분명하지 않습니다. 추천인 작업을 실행 한 다음 평가에 그 출력을 공급 :나는 미리 정의 된 하둡 작업 클래스의 수 (AbstractJob에서 파생 된 물건)와 함께 제공 두싯/하둡

는인가? RMSRecommenderEvaluatorTest를 살펴 보았지만이 모든 것이 모든 것을 할 듯하며 Hadoop 작업처럼 보이지 않습니다. (맛)에서 비 분산 알고리즘과 분산 하둡 작업 (ParallelAls 및 항목 기반의 협업 필터링) :

+0

당신은 이제까지 당신의 문제에 대한 해결책을 찾았나요? 또한 테스트 세트에서 RMSE 메트릭을 생성하는 방법에 대해서도 설명합니다. – stackoverflowuser2010

+0

제가 생각하기에 정확한 답을 표시했습니다. 또한 정밀/리콜 메트릭을 사용하여 일부 평가를 실행하려고했으나 결과는 만족스럽지했다 : 나는 통계는 의미로 내 데이터 세트가 충분히 조밀 생각하지 않습니다. 궁극적으로 우리는 덜 공식적인 평가에 의지했습니다. –

답변

2

는 첫째로 나는 두싯에서 권장 두 부분으로 올 생각합니다. RMSEEvaluator가 비분 할 된 부분에 있고, 그것이 hadoop 작업과 함께 작동한다고 생각하지 않습니다.

두싯에서 하둡 추천 작업을 평가하기 위해

org.apache.mahout.cf.taste.hadoop.als.FactorizationEvaluator 

봐 당신은 또한 몇 가지 스크립트를 작성하고 평가를 위해 로컬 파일 시스템에 추천 결과를 다운로드 할 수 있습니다.

+0

그 결론은 내가오고있는 것과 같은 것 같습니다. 확인을 위해 좀 더 살펴 보겠습니다. 그냥 궁금 –

+1

, 나는 org.apache.mahout.cf.taste.hadoop.als.FactorizationEvaluator이 ... item.RecommenderJob에 의해 생성 된 권장 사항을 평가하는 데 사용할 수 있습니까? – shihpeng