검색 및 순위 지정 서비스에서 많은 PDF 문서를로드하고 있지만 Solr 또는 IBM Retrieve and Rank 서비스에 나중에 PDF 문서의 특정 부분을 나중에 쿼리 필드로 간주해야한다고 알지 못합니다. , 이름 또는 문서 프로세스 ID.IBM Watson - 검색 및 순위 : PDF 문서의 텍스트를 필드로 간주하는 방법을 알려주십시오.
0
A
답변
0
웹 기반 UI를 사용하여 문서를 업로드 할 때 body 및 title과 같은 기본 필드 만 채우므로이 작업을 수행 할 수 없습니다.
그러나 R & R 컬렉션에 PDF 문서의 콘텐츠를 프로그래밍 방식으로 추가 할 수 있습니다. 그리고 이렇게하면 원하는 필드를 자유롭게 추가 할 수 있습니다.
예. 이 예는 author
및 bibliography
같은 추가 필드 이름을 사용하는 것과 같은 방법으로 https://www.ibm.com/watson/developercloud/retrieve-and-rank/api/v1/?java#index_doc
RetrieveAndRank service = new RetrieveAndRank();
service.setUsernameAndPassword("{username}","{password}");
SolrInputDocument newdoc = new SolrInputDocument();
document.addField("id", 1);
document.addField("author", "brenckman,m.");
document.addField("bibliography", "j. ae. scs. 25, 1958, 324.");
etc...
UpdateResponse addResponse = solrClient.add("example_collection", newdoc);
solrClient.commit("example_collection");
의 문서에서, 당신은 이러한 프로세스 ID로 새로 추가 할 수 있습니다.
R & R 콜렉션에 대한 스키마를 업데이트해야 이러한 새 필드를 지정할 수 있습니다. 추가 필드를 지정하는 f}에 대한 예로서 https://github.com/IBM-Watson/kale/blob/master/solr/knowledge-expansion-en.xml#L36의 스키마를 사용할 수 있습니다.
+0
감사합니다! 내 목숨을 구했어. –
스택 오버 플로우에 오신 것을 환영합니다! 좋은 질문을하고 좋은 대답을 얻으려면 [SO Question Checklist] (http://meta.stackoverflow.com/questions/260648/stack-overflow-question-checklist)를 검토하십시오. –