2017-10-03 7 views
1

MITIE가 Rasa와 어떻게 통합되는지 이해하려고합니다. MITIE 파일 total_word_feature_extractor.dat에 정확히 무엇이 들어 있는지 알고 싶습니까? 나는 이것에 대한 좋은 문서를 찾지 못한다.MITIE library for NLP

감사합니다.

답변

3

Github의 MITIE repo에서 충분히 깊숙이 찌르면 답을 찾을 수 있습니다. 예를 들어, 여기에 그 파일에 들어가는 것에 관한 bit of information이 있습니다.

내부 내용은 예 : http://icml.cc/2012/papers/763.pdf의 2 단계 CCA 방법에 기반한 word2vec의 변형입니다. 또한 CCA 방법과 비슷한 것을 포함 시키도록 업그레이드했지만 단어 모양을 생성하기 위해 형태를 분석하여 샘플 단어를 분석합니다. 이로 인해 원래 사전에없는 많은 단어가 포함 된 데이터 세트의 결과가 크게 향상되었습니다.

MITIE가 Rasa에 통합되는 방식은 Rasa의 경우 few backend choices 중 하나입니다. 인 텐트 분류와 NER를 모두 수행 할 수있는 few pipeline components을 제공합니다. 둘 다 SVM을 사용하고 total_word_feature_extractor.dat을 사용하여 개별 단어 벡터를 제공합니다.