2012-04-08 1 views
0

과수원에서 lucene.net을 구성하여 오차드 루트 아래에있는 워드 문서의 내용을 검색 할 수 있습니까? 그리고 다른 웹 사이트의 색인을 생성하는 방법도 있습니다.워드 문서 내부 및 다른 웹 사이트 검색

+0

Lucene.Net *이 콘텐츠 분석 툴킷 *도 아니고 * 웹 크롤러도있다 *. 어떻게 든 * 텍스트를 가져 와서 Lucene.Net을 사용하여 색인을 생성하십시오. –

답변

0

콘텐츠를 과수원 콘텐츠 유형으로 추가 할 수있는 경우 ContentHandler 안에 OnIndexing 방법으로 트릭을 사용할 수 있습니다. 이 같은

뭔가를 수행해야합니다

public class WordDocumentContentHandler: ContentHandler { 
    public WordDocumentContentHandler() { 
     OnIndexing<ContentPart>((context, part) => { 
      // Detect if the part has the field containing the URL to the document 
      // and analyze it here. 
     }); 
    } 
}