나는 항상 POS 태깅이나 다른 시퀀스 태깅을 포함하여 태깅을위한 작업을 평가하는 방법을 모른다. 나는 특히 그 작업의 정밀도, 회상력 및 F1 점수를 계산하는 방법을 모른다. 그런 다음 conlleval.perl이라는 스크립트가 있다는 것을 알았고 직접 평가할 수 있습니다. 그러나 나는 펄 언어를 모른다. 나는 P, R, F1이 태깅 작업에서 어떻게 계산되는지 아직도 혼란 스러웠다. 저에게 말할 수있는 사람이 있습니까?태깅을 평가하기위한 conlleval.perl 스크립트를 이해하는 방법은 무엇입니까?
1
A
답변
0
책 사용 언어 이해의 간단한 정의가있다 : 음성에서 시맨틱 정보를 추출, chapter 3.1.5 Evaluation metrics (고칸 터는, 레나토 드 모리에 의한) 시스템 :
정밀 = 참조 슬롯 # 올바르게 감지를 SLU에 의해 검출 된 총 슬롯 SLU/BY #
리콜 = 올바르게 SLU/총 기준 슬롯
,536 #의 검출 기준 슬롯 # 91,363,210F1 = 2 × 정밀 X 리콜/(+ 정밀 리콜)
참고 : conlleval 전체 측정에 대해 는micro averaging을 이용한다.
여기에 질문이 있습니까? 어떤 코드를 보여 주면 어쩌면. – xxfelixxx
코드에는 질문이 없습니다. B-I-O 시퀀스 태깅을 평가할 때 Precision, Recall 및 F1 점수 계산 방법을 이해하는 방법을 모르겠습니다. – hoestelan
아마 스크립트에 대한 링크일까요? 그렇지 않으면 계산을 명확히 할 수있는 방법이 없습니다. – xxfelixxx