CRF ++를 사용하여 제품 문자열을 다양한 특성 클래스로 구문 분석하여 this question과 유사한 제품 일치를 수행하려고합니다.CRF ++ 템플릿 파일 및 문장 구문
그러나 문제가 발생하는 곳에서는 제품 문자열의 단어 순서가 아직 훈련 파일에 표시되지 않은 경우 CRF가 태그를 정확하게 예측하지 못한다는 것입니다. 이 훈련을 사용하는 경우
panasonic NOUN B-BRAND
digital ADJ B-PRODUCT
monitor NOUN I-PRODUCT
17 # B-SIZE
inch # I-SIZE
: 다음 예 훈련 데이터를 포함
#Unigrams
U00:%x[-1,0]
U00:%x[0,0]
U00:%x[1,0]
#Bigrams
B
그리고 crf_learn
을 실행합니다 예를 들어
panasonic NOUN B-BRAND
monitor NOUN B-PRODUCT
digital ADJ I-PRODUCT
17 # B-SIZE
inch # I-SIZE
내가 무엇이 필요하지만, 않습니다 :
panasonic NOUN B-BRAND
monitor NOUN I-PRODUCT
digital ADJ B-PRODUCT
17 # B-SIZE
inch # I-SIZE
이 내 템플릿 파일에 문제가, 또는 CRF는 본질적으로 구문 제한입니까? 또는 어떻게 든 템플릿 파일이나 교육 데이터 열을 수정하여 제품 문자열의 단어 순서를 캡처하거나 무시할 수 있습니까?