저는 tf-idf measure를 사용하여 두 문장/문서 간의 유사성을 찾기 위해 프로젝트 작업을하고 있습니다. 파이썬에서 matplotlib를 사용한 유사성 측정 방법
나는 다음 샘플 코드 시도 :from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
documents = (
"The sky is blue",
"The sun is bright"
)
tfidf_vectorizer = TfidfVectorizer()
tfidf_matrix = tfidf_vectorizer.fit_transform(documents)
cosine = cosine_similarity(tfidf_matrix[0:1], tfidf_matrix)
print cosine
두 문장 사이의 유사성을
[[ 1. 0.33609693]]
지금 내 질문에 내가 그래픽/시각화 형식의 유사성을 보여줄 수있는 방법입니다. 교차 값이 유사도 측정이나 matplotlib 또는 모든 파이썬 라이브러리에서 사용 가능한 다른 플롯이되는 벤 다이어그램과 같은 것입니다. 벤 다이어그램 대한 사전
원의 반지름은 무엇이며, 원이 두 개 있어야합니다. 두 반지의 반지름이 같아야합니까? 서클의 중심을 어떻게 결정할 수 있습니까? –
둘 다 선택하십시오! 첫 번째 원에 대해 (0,0)을 선택하면 두 번째 원의 중심으로 (d, 0) 또는 (0, d)가 표시됩니다. r에 대해 모른다면 1로 설정하십시오. – jkalden
그러면 d 값은 어떻게 교차점을 나타낼 수 있습니까? 데이터 또는 코드 샘플을 사용하여 설명 할 수 있습니까 –