cosine-similarity

    2

    3답변

    파일 간의 유사점을 감지하고 싶습니다. 이 작업을 수행하는 한 가지 방법은 유사도 알고리즘의 입력 공간을 줄이기 위해 파일을 인코딩하고 두 번째로 더 정확한 결과를 얻는 것입니다. 이는 문서의 유익한 기능 만 고려하여 수행됩니다. 이를 수행하는 한 가지 방법은 tf-idf 빈도 다음에 파일을 벡터 공간 변환으로 변환하여 매우 유익한 용어를 확장하고 빈번한

    2

    1답변

    나는 쿼리와 문서 세트를 가지고있다. 필자는 tf-idf와의 코사인 유사성을 토대로이 문서들의 순위를 매길 필요가있다. 누군가 Lucene에서 이걸 계산할 수있는 지원을 말해 줄 수 있습니까? Lucene에서 직접 계산할 수있는 매개 변수는 무엇입니까? (Lucene의 일부 메서드를 통해 직접 tf, idf를 얻을 수 있습니까?) Lucene과 코사인 유사

    0

    1답변

    코사인 유사성 목록을 백분율로 변환하는 방법이 있습니까? 나는이 두뇌 주위에 내 두뇌를 감싸려고했지만 큰 의문의 여지가있다. 최대 0.9600 + 0.9300 + 0.8800 + 0.8500 = 3.6200 모두 합산 DoC#1 0.9600 DoC#2 0.9300 DoC#3 0.8800 DoC#4 0.8500 을 그들 정상화 : 그것과 같이 네

    -1

    1답변

    에 대한 데이터 세트 도움말 TF-IDF, 벡터 모델 및 TF-IDF 알고리즘의 일부 최적화를 비교하고 싶습니다. 그 때문에 데이터 세트가 필요합니다 (최소 100 개의 영문 텍스트 문서). 나는 하나를 찾을 수 없다. 어떤 제안?

    10

    3답변

    클러스터하고 싶은 큰 데이터 세트가 있습니다. 시험판 실행 크기는 2,500 개입니다. '실제 계약'을 실행하면 최소한 20,000 개의 개체를 처리해야합니다. 이 오브젝트들은 그들 사이에 코사인 유사성을가집니다. 이 코사인 유사성은 수학적 거리 메트릭의 요구 사항을 충족시키지 못합니다. 그것은 삼각형 부등식을 만족시키지 못한다. 저는 예상했던 클러스터의

    5

    1답변

    I 두 행렬 A (M 크기의 X의 N) 및 B (N의 엑스 P)가 사용을 코사인 유사도를 계산. 사실 그들은 벡터의 집합 인 - B.에서의 행 벡터, 열 벡터 I가 a 행렬 A 및 b에서 벡터 (열)이며 모든 쌍 a 및 b 대한 코사인 유사도 점수를 얻으려면이 벡터 (인 B. 매트릭스에서 컬럼) I 매트릭스 C (M 크기의 X의 P) 결과 행렬을 곱하여 시

    0

    1답변

    특정 도메인 (예 : 스포츠 -1 클래스)의 데이터 집합이 있습니다. 내가하고 싶은 일은 내가 웹 페이지를 분류 자 ​​/ 클러스터러에게 보냈을 때 그 인스턴스 (웹 페이지)가 스포츠와 관련이 있는지 여부와 관계없이 결과를 얻고 싶습니다. weka의 대부분의 분류 기준은 LibSVM (래퍼)을 제외한 단항 클래스 데이터 세트를 처리 할 수 ​​없습니다. L

    8

    2답변

    나는 각각 벡터가 m 개의 요소 (실수)를 가지고 있습니다. 나는 모든 쌍 중에서 코사인 유사성이 최대 인 쌍을 찾고 싶습니다. 직접적인 해결책은 O (n m) 시간이 필요합니다. 더 좋은 해결책이 있습니까? 갱신 Cosine similarity/distance and triangle equation 내가 정밀 손실 만 증가가 많은 속도 "코드 길이"로 "

    2

    1답변

    내가 읽고 있었다. Similarity Measure 갑자기 내 온 세상이 무너지고 있었다. 클러스터링 기술을 사용하여 검색 엔진을 구현했습니다. 클러스터링의 경우 유클리드 거리로 거리 측정 값을 갖는 K 평균을 사용했습니다. 결과를 표시하기 위해 코사인 유사도를 사용했습니다. 놀랍도록 정확한 결과를 얻고있었습니다.하지만 지금 내가 읽은 것은, 내가 한 것

    1

    3답변

    이미지에서 데이터를 추출한 후 구성하는 두 개의 M × N 행렬이 있습니다. 두 벡터 모두 긴 첫 번째 행을 가지며 세 번째 행 이후에는 모두 첫 번째 열이됩니다. 이 1,23,2,5,6,2,2,6,2, 12,4,5,5, 1,2,4, 1, 2, 2 : 두 벡터가 처음 세 열이 긴 행이 진행 교체 한 후 박막이 유사한 패턴을 가지고있는 것처럼