레일즈에서 돌아가고 MySQL에 저장된 데이터를 가지고있는 웹 애플리케이션을 지원하는 추천 엔진을 만들고 싶습니다. 사용자가 사물을 클릭하고 그 피드백에 따라 데이터베이스가 업데이트되는 라인을 따라 무언가 실시간으로 변하는 방식으로 처리됩니다. 규모의 순서 나는 모든 사용자에게 10 초의 상호 작용을 초당 1 초라고 생각하고 있습니다. 하루에 1M 데이터 포인트.webapp (레일스 + MySQL +?)에 대한 추천 엔진 구축하기
제 질문은 어떻게하면 신속하게 처리 할 수 있도록 분석하고 구조화 할 수 있습니까? 이미 알고있는 것을 이용하면 Ruby와 R (RServe, RSRuby)을 사용하여 기존 데이터 세트에서 SVD/클러스터링/앙상블/모델을 실행하고 모든 샘플링을 통해 모델/수식을 업데이트 할 수 있습니다. 사물을하기에 정말로 까다로운 방법. 이 일을하는 더 좋은 방법은 무엇입니까? MySQL에서 수학을 직접 실행 하시겠습니까? 훌륭한 수학 함수를 가진 멋진 루비 라이브러리를 사용하고 있습니까? 기성품 추천 엔진 패키지를 사용하십니까?
는 (I 링크 제안 모든 "비슷한 질문에"보고에도 불구하고, 거기에 무엇에 대한 인식의 별개의 부족이 달콤한 아이러니 :(..)PS : 내 배경 : 몇 년 번호 사람 R의,하지만 완전히 등 파이썬, 레일에 신참 프로그래머. 정적/오프라인 데이터에 대한,하지만 난 그 전면에 작업 할 수 있습니다.
그래, 나는 다른 서버에서 너무 자주 cron 작업과 비교하여 실시간으로/트레이드 오프 (시간에 가중치가있는 샘플링 방법을 통해)를 생각 해왔다. 레일스에 대해 알아 내야합니다. recommender-engine stuff에 관해서는 ...나는 성능이 무시 무시할 때 R의 Ruby shell의 맛을 찾을 것이다. rec-engine 주옥은 나가하고 싶는 모든 것을 커버하지 않는 것처럼 보이지만, 나는 모든 것을 면밀히 관찰 할 필요가있다. – binarysolo
답변을 수락했습니다. 내가 찾은 Ruby 추천 라이브러리는 (R의 유사한 오퍼링과 비교하여) 꽤 끔찍하다. 아마도 RRuby를 지금 사용하고 더 나은 것이 있는지 살펴볼 것입니다. – binarysolo
죄송합니다. 더 이상 도움이 될 수 없습니다 .. – Tigraine