2017-09-09 10 views
1

텍스트 분류를위한 fastText를 구현합니다. https://github.com/facebookresearch/fastText/blob/master/tutorials/supervised-learning.md 정확도가 @ 1인지 P5인지 궁금합니다. 나는 이진 분류를했다,하지만 난 다른 번호를 테스트, 나는 결과를 이해하지 않습니다fastText에서 정밀도와 리콜?

haos-mbp:fastText hao$ ./fasttext test trainmodel.bin train.valid 2 
N 312 
[email protected] 0.5 
[email protected] 1 
Number of examples: 312 
haos-mbp:fastText hao$ ./fasttext test trainmodel.bin train.valid 1 
N 312 
[email protected] 0.712 
[email protected] 0.712 
Number of examples: 312 
haos-mbp:fastText hao$ ./fasttext test trainmodel.bin train.valid 3 
N 312 
[email protected] 0.333 
[email protected] 1 
Number of examples: 312 

답변

2

정밀 관련 결과를 프로그램에 의해 검색 결과의 총 수의 비율이다. 문서 검색 엔진이 쿼리와 관련이있는 100 개의 문서를 검색 한 다음 정밀도는 90/100 (0.9)이라고 가정합니다. 100 개의 결과로 정밀도를 계산 했으므로 P @ 100입니다.

리콜은 알고리즘에 의해 검색된 관련 결과의 비율과 모든 관련 결과의 총 수입니다. 위와 같은 예제를 통해 관련 문서의 총 수가 110 개일 경우 리콜은 90/110입니다.

간단히 말해서 리콜은 정보 검색 프로그램이 정보 검색 프로그램을 가져 오는 관점에서 평가하는 데 도움이됩니다 관련 결과; 정밀도는 결과의 정확성을 평가하는 데 도움이됩니다.

빠른 검색으로 이진 분류도 확인하십시오. https://github.com/facebookresearch/fastText/issues/93