2013-12-12 4 views
1

저는 Solr에게 매우 익숙합니다. 그래서 이것은 어리석은 질문 일 수 있습니다.Solr은 문서 당 요약을 강조 표시 할 수 있습니까?

요구 사항은 쿼리 텍스트와 일치하는 강조 표시된 단어가 포함 된 (지능형) 요약으로 결과를 반환해야한다는 것입니다. 내가 읽은 것으로부터, 강조 표시된 텍스트가 효과적으로 문서 요약이 될 것입니다. 그러나 솔직은 일부 문서에 대한 강조 표시를 제공하지 않습니다. 따라서 Solr이 강조 표시된 텍스트 (요약)를 제공 할 수없는 문서가있는 경우 Solr에 을 요청합니다. a) 일반 문서 요약 (검색어가 무엇이든 관계 없음) 또는 b) top n terms

그러나 두 항목 중 하나에서 진전을 이루지 못했습니다.

근본적인 질문은 Solr이 특정 문서에 대해 강조 표시된 요약을 생성하지 않는 이유입니다. 문서에 내가 찾고있는 용어가 포함되어 있다는 사실을 알고 있습니다.

이것에 대한 통찰력은 매우 높이 평가됩니다. 고맙습니다.

EDIT1 :

검색어 :/선택/Q = 에이전트 = 0 & FL = full_path, 저자, 제목, 내용 유형을 시작 & HL = 사실 & hl.snippets = 5 점수 &.

문서는 PDF 문서이므로 단어 'agents'가 한 번 나타납니다. 다음은 단어가 포함 된 PDF의 텍스트 스 니펫입니다. "Omega 3 & 6 가지 지방산 (에이코 사 펜타 엔 산)과 DHA (docasahexaenoic acid)는 항염증제 역할을하는 어유의 구성 성분입니다 (일반적으로이 제품은 건강 식품 매장에서 연어 오일 또는 다른 이름으로 따로 판매됩니다 .) "

편집 2 :

기본 필드 (DF)가 solrconfig.xml에서 텍스트로 설정됩니다. 모든 필드를 text_general으로 정의 된 텍스트라는 필드에 복사합니다. text_general 필드 유형을 살펴보면 지정되는 유일한 토크 나이저는 입니다. solr.StandardTokenizerFactory입니다. 여기서 강조해야 할 것은 강조 표시가 작동한다는 것입니다. 문제는 일부 문서에서 작동하지 않는다는 것입니다. 편집 1에는 주어진 쿼리로 강조 표시해야한다고 생각되는 문서 텍스트에 대한 정보가 들어 있습니다.

+0

매우 흥미로운 질문입니다. solr이 강조 표시하지 못한 문서에 대한 자세한 정보를 abit에 제공 할 수 있습니까? 당신이 선호하는 질의와 예제 요약은 무엇입니까? – Arun

+0

나는 질문을 편집하고 요청 된 정보를 추가했습니다. 고맙습니다. – Harinder

+0

여기에 사용되는 토크 나이저는 무엇입니까? 에이전트 단어가 문제를 만든 후에 점과 같습니다. 또한 쿼리에 hl.q 매개 변수를 추가하십시오. – sidgate

답변

-1

텍스트를 강조 표시해야하는 모든 입력란에 "true"가 입력되어 있는지 확인하십시오. Solr은 강조 표시 할 수 있으며 원본 텍스트에 액세스해야 필드의 원래 텍스트에 액세스 할 수 있습니다.이 텍스트는 "저장"해야합니다. 위에서 언급 한 텍스트가 들어있는 필드를 확인해야합니다. 예 :.

+0

문제를 디버깅하는 동안 stored = true를 모든 필드에 설정 했으므로 현재로서는 문제가되지 않습니다. – Harinder