2017-10-10 32 views
1

문서 분석과 관련하여 질문이 있습니다. Apache Tika를 사용하면 다른 유형의 다른 파일의 컨텐츠 및 메타 데이터를 생성 할 수 있습니다.Apache Tika 대 Apache Lucene

티카로 파일 (형태소 분석)의 키워드를 구할 수 있습니까? 아니면 여전히 Lucene이 필요합니까?

답변

0

나는 그것이 가능한지 모르지만 나는 lucene에서 모든 키워드 분석을하는 것이 좋습니다. 내 개인적인 이유 :

  • 티카의 주요 목표는
  • Lucenes을 파일에서 정보를 추출하는 데이터 분석 및 인덱싱하려고하는 방법을 정의합니다. 어떻게 데이터를 분석 할 것이다 것은 검색에 루씬 인덱스 performes
  • 는 티카 만 추출하고 루씬 검색에 대한 관심의 분리의 종류의 관련 일
을 (물건을 찾는 당신이 찾아 낼 것으로 예상) 방법에 큰 영향을 미친다