2016-10-20 3 views
0

검색 및 순위 지정 서비스에서 많은 PDF 문서를로드하고 있지만 Solr 또는 IBM Retrieve and Rank 서비스에 나중에 PDF 문서의 특정 부분을 나중에 쿼리 필드로 간주해야한다고 알지 못합니다. , 이름 또는 문서 프로세스 ID.IBM Watson - 검색 및 순위 : PDF 문서의 텍스트를 필드로 간주하는 방법을 알려주십시오.

+0

스택 오버 플로우에 오신 것을 환영합니다! 좋은 질문을하고 좋은 대답을 얻으려면 [SO Question Checklist] (http://meta.stackoverflow.com/questions/260648/stack-overflow-question-checklist)를 검토하십시오. –

답변

0

웹 기반 UI를 사용하여 문서를 업로드 할 때 body 및 title과 같은 기본 필드 만 채우므로이 작업을 수행 할 수 없습니다.

그러나 R & R 컬렉션에 PDF 문서의 콘텐츠를 프로그래밍 방식으로 추가 할 수 있습니다. 그리고 이렇게하면 원하는 필드를 자유롭게 추가 할 수 있습니다.

예. 이 예는 authorbibliography 같은 추가 필드 이름을 사용하는 것과 같은 방법으로 https://www.ibm.com/watson/developercloud/retrieve-and-rank/api/v1/?java#index_doc

RetrieveAndRank service = new RetrieveAndRank(); 
service.setUsernameAndPassword("{username}","{password}"); 

SolrInputDocument newdoc = new SolrInputDocument(); 
document.addField("id", 1); 
document.addField("author", "brenckman,m."); 
document.addField("bibliography", "j. ae. scs. 25, 1958, 324."); 
etc... 

UpdateResponse addResponse = solrClient.add("example_collection", newdoc); 

solrClient.commit("example_collection"); 

의 문서에서, 당신은 이러한 프로세스 ID로 새로 추가 할 수 있습니다.

R & R 콜렉션에 대한 스키마를 업데이트해야 이러한 새 필드를 지정할 수 있습니다. 추가 필드를 지정하는 f}에 대한 예로서 https://github.com/IBM-Watson/kale/blob/master/solr/knowledge-expansion-en.xml#L36의 스키마를 사용할 수 있습니다.

+0

감사합니다! 내 목숨을 구했어. –