4

"사용자 A와 사용자 B가 제품 C를 좋아한다면 서로를 따르는 데 관심이있을 것입니다"라는 빠른 속도는 무엇입니까? 런타임에서의 유사성 계산이 똑똑하다고 생각하지 않습니다. 응답 속도가 느려지니까요. 한편, 야간 인덱스를 계산하려면 (N * N-1) 개의 다른 실행을해야합니다. 여기서 N은 사용자 수입니다.별로 영리하지는 않습니다. 또한 사용자가 신제품을 좋아하거나 새로운 사용자를 등록 할 때마다 색인을 다시 계산해야합니다.추천 엔진과 관련하여

여기에 적용 할 수있는 가장 똑똑한 점은 무엇입니까? 어떤 종류의 초고속 해싱은 새 항목 만 추가됩니까?

답변

0

Uni의 과정에서 공부 한 알고리즘 중에는 이와 같은 문제를 다루는 알고리즘이있었습니다. 그들의 권장 접근 방식은 각 사용자 쌍에 대해 "유사성"색인을 계산하는 것이 었습니다. (나는 당신의 N * N 방법을 언급 한 것 같습니다.)이 기준에 따라 특정 사용자가 가장 가까운 사용자를 결정합니다.

물론 검색 엔진 크롤러가 작동하는 것처럼 모든 변경 사항에 대해 유사도 지수를 즉시 다시 계산할 필요는 없습니다. 사실 초기 색인을 계산하면 다양한 휴리스틱 방법을 사용하여 선호도를 빠르게 변경하는 사용자에 대해 더 자주 재 계산할 수 있으며 드물게 변경하는 사용자에게는 훨씬 느립니다.

0

RDF 데이터베이스에 대해 생각해 보셨습니까? Like OWLIM