2017-12-12 11 views
0

나는 Semafor에 대한 입력으로 사용할 수있는 Stanford Core NLP에서 conll 파일을 생성하려고합니다 (semafor가 conll 파일 만 허용 함).다른 CoNLL 형식 이해하기

생성 된 파일은 다음과 같습니다 :이 파일을 사용하는 경우 Semafor 서버가 illegalArgument 예외를 반환

1 My my PRP$ O 2 nmod:poss 
2 kitchen kitchen NN O 5 nsubj 
3 no no RB O 4 neg 
4 longer longer RB O 5 advmod 
5 smells smell VBZ O 0 ROOT 
6 . . . O 5 punct 

형식이 약간 다르기 때문에. 그들의 예제 conll 파일은 다음과 같습니다 :

1 My _ PRP$ PRP$ _ 2 NMOD _ _ 
2 kitchen _ NN NN _ 5 SBJ _ _ 
3 no _ RB RB _ 5 ADV _ _ 
4 longer _ RB RB _ 3 AMOD _ _ 
5 smells _ VBZ VBZ _ 0 ROOT _ _ 
6 . _ . . _ 5 P _ _ 

키를 정의하여 출력을 제어 할 수있는 것처럼 보입니다. 기본 키는 ID, FORM, LEMMA, POSTAG, NER, HEAD, DEPREL입니다. 그러나 Semafor가 제공하는 예제 conll 파일의 키를 알지 못합니다. 생성 된 파일 형식을 Semafor 예제 파일 형식으로 변환하는 방법을 알려주십시오.

답변

0

나는 Semafor가 자신이 필요로하는 포맷으로 자체 conll 파일을 생성 할 수 있다고 믿는다. 우리는 스탠포드 코어 NLP를 사용하여 문서를 한 줄당 문장으로 분리 한 다음 Semafor 자체를 사용하여 파일을 생성합니다.