cosine-similarity

2열

1답변

나는 1, 4, 3, 마찬가지로 1 (ID1) 3 PHP에서 (ID1) 사이의 코사인 유사도를 계산하려면, 4 공식은 다음과 같이 될 것이다 : 유사성 = (1.1 × 3.1 + 1.4 × 3.4)/((1.1)^2 + (3.4)^2)^0.5) = (4 * 4 + 8 * 4)/(((16 + 16 + 64)^0.5) (16 + 16)^0.5)) 내 데이터 집합

0열

1답변

mapreduce 사용자 유사도 행렬을 계산하는 방법

각 사용자의 사용자 선호도를 나타내는 10 개의 부동 소수점 숫자가 뒤에 오는 사용자 ID로 표시되는 많은 사용자 목록 (1,000 만 개 이상)이 있습니다. Mapreduce를 기반으로 한 코사인 유사성을 사용하여 사용자 유사성 행렬을 효율적으로 계산하고 싶습니다. 그러나 값은 부동 소수점 숫자이므로 맵 축소 프레임 워크에서 키를 판별하기 어렵습니다. 어

0열

2답변

코사인 유사성 [파이썬] 데이터와 쿼리의 코사인 유사도를 계산 내 함수의 다음 코드로

: def rank_retrieve(self, query): """ Given a query (a list of words), return a rank-ordered list of documents and score for the query. self.docs : list of documents self

0열

3답변

코사인 유사성 결과가 하나 이상

PHP에서 코사인 유사성을 코딩하고 있습니다. 때로는 formula이 결과를 제공합니다. inverse cos을 사용하여이 수에서 차수를 도출하려면 1과 0 사이 여야합니다. 나는 1을 더 가깝게할수록 차수가 필요 없다는 것을 안다. , 0에 가까울수록 덜 유사합니다. 그러나 나는 1보다 큰 숫자를 어떻게 만들지 모르겠다. 그것은 단지 그것이 완전히 다른

-2열

1답변

Python - 중첩 된 사전 구조와의 코사인 유사도

다양한 학생간에 식량 벡터의 코사인 유사성을 수행하려고합니다. 나는이 포함 된 CSV 파일이 : Student food amount John apple 15 John banana 20 John orange 1 John grape 3 Ben apple 2 Ben orange 4 Ben strawberry 8 Andrew

0열

2답변

벡터 사이의 거리 측정

나는 어떤 방식 으로든 비교하고 싶은 300.000 정도의 벡터 세트를 가지고 있는데, 주어진 하나의 벡터에서 나는 세 가지 방법을 생각한 가장 가까운 벡터를 찾을 수 있기를 원합니다. 간단한 유클리드 거리 코사인 유사도 는 그람 행렬을 계산하도록 (예를 가우시안 용) 커널을 사용. 벡터를 이산 확률 분포로 처리하고 ( 감각을 만들어 냄) 일부 발산 측정을

0열

1답변

친화적 인 주파수, 코사인의 유사성에 대한 TFIDF 사용

나는 코사인 거리를 계산하기 위해 상대 주파수에 대해 TFIDF를 사용하려고합니다. 한 문서에서 10 단어를 선택했습니다 : 파일 1과 10 단어 및 빈도를 사용하여 파일 1과 유사한 10 개의 파일을 확인하면서 내 폴더에서 다른 10 개의 파일을 선택했습니다. 폴더의 파일 총 수는 다음과 같습니다. 46.i DF (단어가 나타나는 문서의 수) IDF (파

0열

2답변

Matlab에서 코사인 유사성을 얻는 방법은 무엇입니까?

이처럼 Matlab에서 코사인 유사성을 구현했습니다. 사실, 저는 2 차원의 50 x 50 매트릭스를 가지고 있습니다. 코사인을 얻으려면 항목을 라인 형식으로 비교해야합니다. for j = 1:50 x = dat(j,:); for i = j+1:50 y = dat(i,:); c = dot(x,y); sim

2열

1답변

Mahout rowSimilarity

위키 피 디아 문서 간의 행 유사성을 계산하려고합니다. 나는 Key class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable 형식의 tf-idf 벡터를 가지고있다. 여기에서 텍스트 분석의 빠른 여행을 다음하고 다음과 같이 https://cwik

4열

1답변

tm.package : findAssocs vs Cosine

저는 여기에 새로 왔으며 나의 질문은 나의 접근 방식이 합리적인지 여부에 대한 두 번째 의견을 얻고 자하는 자연을 프로그래밍하는 것이 라기보다는 수학적입니다. tm 패키지의 findAssocs 함수를 사용하여 내 컴퓨터에서 단어 간의 연결을 찾으려고했습니다. New York Times와 US Congress와 같이 패키지를 통해 사용할 수있는 데이터에 대해