나는 다음과 같이 웹 페이지의 컨텐츠를 저장하기위한 SOLR의 제공 구성 text_general
필드를 사용 :Apache Solr에서 두문자어를 사용하는 방법?
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
필드 :
ABC=>Apple Ball Company
:
<field name="content" type="text_general" stored="true" indexed="true"/>
말, synonyms.txt
에 나는 항목이
content
필드에서 검색을 수행하는 경우 q=content:ABC
내 데이터에 내가하는 곳 "Apple Ball Company
"과 (과) 관련된 콘텐츠가 없습니다.
나는 모든 단어하지 같은 순서도 함께 심지어 현재 그 단어를 포함하는 내 content
에서 Apple
, Ball
및 Company
에 대한 강조-조각을 얻는다.
약어 ABC
및/또는 확장명이 "Apple Ball Company
"인 경우에만 강조 표시를 원합니다 (이 단어들이 동일한 순서로 함께 표시되는 경우).
동일한 레코드에 'Apple Ball Company'라는 시퀀스가있는 경우에도 'Apple'만 '볼'과 '회사'만 강조 표시됩니다. 감사합니다 @ drz, 그것은 효과가있다. –