2017-11-22 5 views
2

spaCy v2.0에 익숙해지기 시작했습니다. 내 자신의 문서로 Lightning_Tour.py를 실행할 때, 줄 끝 문자열 \n이 엔티티 출력에서 ​​지속적으로 GPE로 태그 지정되고 있음을보고 있습니다.spaCy에서 영어 'NER'가 ' n'을 GPE로 계속 태그하는 이유는 무엇입니까?

이렇게 태그를 지정하지 않으려면 문서를 사전 처리 할 방법이 있습니까? 아니면 기본 영어 모델의 동작입니까?

+1

이 질문을 한 후 spaCy github 사이트 [https://github.com/explosion/spaCy/issues/1717]에 문제가 공개되었습니다. – demongolem

답변

1

예 현재 기본 모델 (spaCy 2.0.5를 사용 중입니다)과 다른 사람들이 본 모습입니다 (위의 내 코멘트 참조). 이 문제를 해결하려면 당분간 생성 된 엔티티를 후 처리해야합니다.