0

나는 standfordNER 분류기를 사용하여 텍스트를 분류했습니다. 다음은 코드입니다.standfordner 분류기에서 xml 출력을 생성하려면 어떻게해야합니까?

string docText = fileContent; 
     string txt = ""; 
     var classified = Classifier.classifyToCharacterOffsets(docText).toArray(); 

     for (int i = 0; i < classified.Length; i++) 
     { 
      Triple triple = (Triple)classified[i]; 

      int second = Convert.ToInt32(triple.second().ToString()); 
      int third = Convert.ToInt32(triple.third().ToString()); 
      txt = txt + ('\t' + triple.first().ToString() + '\t' + docText.Substring(second, third - second)); 

      string s = Classifier.classifyWithInlineXML(txt); 
      string s1 = Classifier.classifyToString(s, "xml", true); 
      Panel1.GroupingText = s1; 

     } 


     Panel1.Visible = true; 

및이 넣어 밖으로 :

LOCATION Lanka LOCATION colombo ORGANIZATION microsoft 

하지만 난, 내가 사용하고 내 코드에서이

<LOCATION> Lanka </LOCATION> <LOCATION>colombo</LOCATION> <ORGANIZATION> microsoft</ORGANIZATION> 

같은 XML 형식에 넣어 아웃이 필요

string s = Classifier.classifyWithInlineXML(txt); 
      string s1 = Classifier.classifyToString(s, "xml", true); 

xml을 가져 오지만 작동하지 않습니다. 이 분야에 새로운 사람들이 있기 때문에이 문제를 해결하기 위해 도움을주십시오. 덕분에이 샘플 코드가 도움이되어야한다

답변

1

많은 :

String content = "..."; 
    String classifierPath = "edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz"; 
    AbstractSequenceClassifier<CoreLabel> asc = CRFClassifier.getClassifierNoExceptions(classifierPath); 
    String result = asc.classifyWithInlineXML(content);