다음으로 영감을 받았습니다 git 및 videoword2vec
을 내 검색어의 동의어로 사용하여 내 도메인의 개념적 검색을 만들려고합니다.노드 JS 클라이언트를 사용하여 Elasticsearch 색인에서 가장 중요한 단어 추출
다음과 같은 문서 구조주기 (? TF-IDF) 나는 전체 색인을 통해 반복하고 "더 크게"로 단어를 추출하고 싶습니다
{
"_index": "conversations",
"_type": "conversation",
"_id": "103130",
"_score": 0.97602403,
"_source": {
"context": "Welcome to our service, how can I help? do you offer a free trial",
"answer": "Yes we do. Here is a link for our trial account."
}
}
합니다.
일단 상위 100 단어 목록을 갖게되면 word2vec
을 사용하여 동의어 필터를 만듭니다.
내 질문은 : ES 노드 JS 클라이언트를 사용하여 어떻게 수행 할 수 있습니까? 문서
TF-IDF는 컬렉션에 대한 정의되지 않은 일반적인 신체, 그것은 문서에 정의되어있다. 당신은 idf 부분으로 끝날 것입니다, 그것은 당신이 찾고있는 것이 매우 의심 스럽습니다. –
답장을 보내 주셔서 감사합니다. 색인에서 중요한 단어를 추출하는 더 나은 방법을 제안 할 수 있습니까? –
@ShlomiSchwartz를 사용하면 솔루션이 suggester가 이미 제공 한 기능보다 더 나은 방법을 설명 할 수 있습니까? – AR1