저는 Solr을 사용하여 XML 파일에서 구문 분석 된 정보의 검색을 실행하기를 바라고 있습니다. 이러한 XML 파일은 Solr의 문서 형식이 아니므로이를 구문 분석하고 필자가 필요로하는 필드를 가져와야합니다.Apache Solr, SolrJ 대 XML 구문 분석을위한 데이터 가져 오기 처리기
저는 Java 프로그래밍에 익숙하며 SolrJ가 데이터 가져 오기 처리기를 사용하는 것보다 쉬운 방법인지 궁금합니다. 내가 가진 각 XML 파일을 실행하고 각각에서 필요한 필드를 구문 분석하는 것을 고려하고 있습니다. 한 가지 방법에 다른 단점이 있습니까? Java에 익숙해지면서 XML을 파싱하는 것이 더 쉬울 수도 있기 때문에 상상할 수 있습니까?
아마 여러 조건과 정규식이 필요할 것입니다. 무엇보다 신뢰할 수있는 방법으로 상대적으로 구조화되지 않은 XML에서 내 필드를 가져올 수 있습니다.
SolrJ는 인터페이스와 어떻게 작동합니까? 즉, SolrJ를 사용하여 색인을 생성하면 인터페이스를 통해 내 쿼리를 여전히 수행 할 수 있습니까?
그리고 DIH는 SorlJ로 모든 문서를 추가하는 것보다 빠릅니다. –