2011-03-01 2 views
2

sunspot/solr/lucene (또는 다른 검색 엔진)이 색인을 생성 한 기사 목록이 있다고 가정 해 보겠습니다.Sunspot/Solr/Lucene : 유사한 기사 찾기

주어진 기사와 유사한 기사를 찾는 데 어떻게 사용할 수 있습니까? http://developer.yahoo.com/yql/console, 또는 http://www.alchemyapi.com/api/demo.html에서 http://www.wordsfinder.com/api_Keyword_Extractor.php, 또는 termextract :

이이처럼 재개 도구를 사용하여 수행해야 하는가?

+0

좋은 답변에 감사드립니다. –

+0

[answer] (http://stackoverflow.com/questions/5122788/reducing-similar-top-results-in-solr-result-output/5123165#5123165) – Karussell

답변

1

당신이하려는 것은 내가 this answer에 설명 된 작업과 매우 비슷합니다.

간략히 요약하면, 각 문서를 다른 문서와 비교하기 위해 쿼리로 사용할 수있는 요약을 생성해야합니다. 문서 요약은 해당 문서의 상위 N 개 용어만큼 간단 할 수 있습니다 (중지 단어 제외). 타사 도구를 사용하지 않고도 Lucene 문서에서 상위 N 개 용어를 쉽게 생성 할 수 있습니다. SOweb에 대한 예제가 많이 있습니다.