2013-01-23 3 views
2

내 모든 XML 파일을 다른 서버에 저장 했으므로 다른 서버에 SOLR을 설치하고 구성했습니다. XML 파일을 어떻게 SOLR에 색인화 할 수 있습니까? 나는 nutch를 체크했으나 주요 목적은 html 페이지를 크롤링하고 색인을 생성하는 것입니다. 나는 크롤링 할 필요가 없다. 다른 서버의 특정 경로에있는 모든 파일이 있습니다. SOLR에서 XML 파일의 색인을 생성하기 만하면됩니다. SOLR4를 설치하고 구성했습니다.solr4의 다른 서버에 저장된 색인 생성 XML 파일을 수행하는 방법

누군가가 이와 같은 일을했다면 어떻게하는지 알려주세요. 감사합니다.

답변

1

DataImportHandler을보세요. 적절한 권한이 설정되어 있으면 네트워크 파일에 액세스 할 수 있어야한다고 생각합니다.

+0

쉐인 : 적절한 권한과 해당 서버의 사용자 이름 및 암호도 가지고 있지만 제안하는 방식대로 작동하지 않습니다. 파일이 완전히 다른 서버에 있기 때문입니다. 질문이 있습니다. 엔티티 탭의 데이터 구성 파일에는 URL 이라는 필드가 있습니다.이 URL = "10.20.30.40 /home/data/delivery/textarticles.xml"을 언급 할 수 있습니까? 그것은 작동합니까? 여기서 그 서버의 사용자 이름과 암호를 언급해야합니다. –

2

은 왜 SOLR 서버에서 드라이브를 탑재하고, 같은 것을하지 :

자바 -jar post.jar "Z : \ 홈 \ 데이터 \ 전달 \의 textarticles.xml"

post.jar을 exampledocs 폴더에 있습니다. 또한 예제 응용 프로그램으로 사용하고 자신의 응용 프로그램을 작성하여 다른 서버에서 xml 파일을 게시 할 수도 있습니다.

0

Shane Alexander의 대답에 대한 귀하의 의견을 바탕으로 DataImportHandler의 URLDataSource 옵션을 사용해야합니다. URL을 통해 파일. 또한 인증 지원을 위해 SOLR-1490의 패치를 통합해야합니다.

+0

답장을 보내 주셔서 감사합니다. Paige Cook : 기존 SOLR4 설치에 SOLR-1490 패치를 어떻게 적용 할 수 있습니까? 이 패치를 적용하기 위해 내가 정확히해야 할 일이 무엇인지 알고 있습니까? 당신이 언급 한 URLDataSource는 solr4를위한 것인가? –

+0

예, URLDataSource는 Solr 4와 작동합니다 (위키의 Solr 1.4 레이블은 Solr 1.4 이후로 주변에 있음을 나타냄). 패치는 URLDataSource.java 파일의 소스 코드 변경 사항입니다. Solr 소스를 http://lucene.apache.org/solr/versioncontrol.html에서 가져 와서 필요한 변경을 수행하고 Solr을 다시 컴파일해야합니다. –

+0

Thanks @ PaigeCook : [lucene.apache.org/solr/versioncontrol.html](http : //lucene.apache.org/solr/versioncontrol.html)에서 소스 코드를 다운로드했습니다. 그래서 나는 이미 거기에 있었고 아무것도 할 필요가 없다고 생각합니다. 이제 SOLR에서 URLDataSource를 사용해 보겠습니다. 나는 엄지 손가락을 포기하고 싶지만 그렇게하기에는 충분한 평판이 없지만 당신의 도움에 정말 감사드립니다. –