2016-06-15 2 views
2

워크 시트의 IBM Watson에서 Solr 스키마를 질문 모음으로 정의했습니다. 다중 값 필드 인 스키마 요소는 거의 없습니다. Retrieve 및 Rank Services를 사용하여 문서를로드하고 문서를 인덱싱 할 수 있지만 Training Dataset을 생성 할 때 데이터 형식 변환 오류가 발생합니다.IBM watson 검색 및 순위 지정 교육 오류 "java.util.ArrayList를 java.lang.Float로 캐스팅 할 수 없습니다."

스키마

<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false"/> 
    <field name="worksheet_number" type="watson_text_en" indexed="true" stored="true" /> 
    <field name='question_number' type='int' indexed='true' stored='true' multiValued='true' /> 
    <field name='question_type' type='watson_text_en' indexed='true' stored='true' multiValued='true' /> 
    <field name='answer' type='watson_text_en' indexed='true' stored='true' multiValued='true' /> 
    <field name='text' type='watson_text_en' indexed='true' stored='true' multiValued='true' /> 

교육 명령에서 예외가 발생 -u 말림 train.py를 사용하여 "***********": "******* ***** ""https://gateway.watsonplatform.net/retrieve-and-rank/api/v1/rankers/3b140ax15-rank-3108

불행하게도, 예외가 예외를 던지고있는 필드에 대한 정보를 제공하지 않습니다.

Java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.Float 
    at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.toCSV(FCFeatureGeneratorComponent.java:677) 
    at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.process(FCFeatureGeneratorComponent.java:364) 
    at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:272) 
    at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:155) 
    at org.apache.solr.core.SolrCore.execute(SolrCore.java:2082) 
    at org.apache.solr.servlet.HttpSolrCall.execute(HttpSolrCall.java:651) 
    at org.apache.solr.servlet.HttpSolrCall.call(HttpSolrCall.java:458) 
    at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:229) 
    at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:184) 
    at org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1652) 
    at org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:585) 
    at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:143) 
    at org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:577) 
    at org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.java:223) 
    at org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1127) 
    at org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:515) 
    at org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.java:185) 
    at org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1061) 
    at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:141) 
    at org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHandlerCollection.java:215) 
    at org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:110) 
    at org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:97) 
    at org.eclipse.jetty.server.Server.handle(Server.java:499) 
    at org.eclipse.jetty.server.HttpChannel.handle(HttpChannel.java:310) 
    at org.eclipse.jetty.server.HttpConnection.onFillable(HttpConnection.java:257) 
    at org.eclipse.jetty.io.AbstractConnection$2.run(AbstractConnection.java:540) 
    at org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:635) 
    at org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:555) 
    at java.lang.Thread.run(Thread.java:745)\n","code":500}} 

THER e는 Schema에 정의 된 MultiValue 필드와 이에 대한 Training Data 세트 생성 문제로 나타납니다. MultiValue 필드를 사용하면 여러 가지 질문을 저장할 수 있으며 모든 데이터 유형에 대해 주어진 워크 시트 번호의 텍스트를 저장할 수 있습니다. 예 : question_number 필드에 [1,2,3,4,5] 값이있는 Question 번호의 정수입니다.

교육 데이터 집합을 생성 할 때 Watson API는 "java.util.ArrayList를 java.lang.Float로 캐스팅 할 수 없습니다."라는 데이터 형식 변환 오류가있는 예외를 throw합니다.

답변

1

이 문제는 잠재적으로 데이터에 "점수"라는 다중 값 필드가 있기 때문에 발생합니다. schema.xml의 명시 적으로 정의 된 필드이거나 일부 문서의 유효한 동적 필드 일 수 있습니다. 이 경우인지 확인할 수 있습니까? 그렇다면 다른 이름 (예 : "my_score")으로 변경해야합니다. 이는 점수를 반환하기 위해 Solr이 하드 코딩 한 이름과 충돌하기 때문입니다.

+0

지원해 주셔서 감사합니다. '점수'입력란이 있습니다. 스키마를 수정하고 업로드 한 다음 작동하는지 확인해 드리겠습니다. –

+0

현재 작동 중입니다. 과거 예외가 발생했으며 교육 데이터 세트를 생성 중입니다. –