cluster-analysis

    -1

    1답변

    sklearn kmeans documentation에 따르면 k-means에는 shape = (n_samples, n_features) 행렬이 필요합니다. 그러나 shape = (n_samples, n_samples)의 거리 매트릭스를 제공했는데, 각 인덱스는 두 문자열 사이의 거리를 유지합니다. 시계열은 SAX 표현을 사용하여 문자열로 변환되었습니다. 거

    0

    2답변

    우리가 클러스터로 나누어 2 차원 공간 Voronoi Tessellation를 통해 말을 말해봐 : 우리는 클러스터가 설명 중간 지점이있다. 그러한 공간에서 포인트 (x, y 좌표)가 주어지면 해쉬를 어떻게 가져 와서 어느 클러스터에 속하는지 결정할 수있게됩니까? 우리는 레이어를 추가하고 트리 검색을 사용하여 포인트가 속한 위치를 그림으로써 클러스터를 이진

    0

    1답변

    scikit-learn을 사용하여 훈련 된 k-means 모델에서 여러 테스트 문서의 클러스터를 예측하려고합니다. vectorizer = TfidfVectorizer(stop_words='english') X = vectorizer.fit_transform(train_documents) k = 10 model = KMeans(n_clusters=k,

    14

    2답변

    관심 및 위치에 따라 일치하는 항목을 찾을 수있는 Android 모바일 앱에서 작업하려고합니다. 많은 데이트 응용 프로그램은 이미 위치, 성별 및 나이 등을 기준으로 Tinder 검색과 같은 몇 가지 기능을 이미 수행하고 있습니다. 이미 완료된 경우 다시 작성하고 싶지 않습니다. 나는 구글에서 검색 한 일부는 내가 몇 아래의 기준에 일치하는 매칭 알고리즘을

    4

    1답변

    좀 클러스터 분석을 실행하는거야 내가 두 가지 일을 알아 내려고 해요 : 1) 가장 pvclust의 P-값의 결과를 해석하는 방법을 (가 구축되어 널 무엇인가?) 어떻게이 내가 예로 설정 mtcars 데이터를 사용합니다 hclust 이러한 결과를 번역하는 2) ... pvclust를 사용하여 먼저 함수 (유클리드 먼을 사용) CE 및 완전한 연결) : :

    3

    1답변

    scikit-learn의 유사도 전파 구현을 사용하여 유사성 측정 기준으로 수정 된 Jaro-Winkler 거리를 사용하여 엔티티 이름 집합을 클러스터링하는 결과를 얻었지만 클러스터 수가 여전히 너무 많습니다 (예 : 너무 높음). 많은 잘못된 반응) 나는 다음과 같은 설명과 함께, 클러스터의 수에 영향을 미치는 '환경 설정'매개 변수가 존재하는 sciki

    -1

    1답변

    나는 1500 명의 환자의 폐 이미지가 있습니다. 그리고 나는 그들에게 kmean을 적용하여 내 문제를 해결하려고합니다. 내 문제는, 한 환자 (230 개의 이미지를 가짐)에 k 평균을 적용한 다음이 환자의 중심을 저장하고 싶습니다.이 중심에 기반하여 다른 환자에게 kmeans를 적용하고 싶습니다. 이것은 MATLAB 코드입니다. [idx,C] = kmea

    0

    1답변

    약 150,000 개의 문서에 대한 구조화되지 않은 데이터가 있습니다. 나는 감독되지 않는 학습 알고리즘을 사용하여이 문서들을 그룹화하려고 노력 중이다. 현재 gensim Python에서 LDA (Latent Dirichlet allocation)를 사용하고 있습니다. LDAModel의 경우 num_topics = 20을 전달했습니다. 따라서 내 전체 15

    0

    1답변

    각 기사마다 1000 개 이상의 기사가 포함 된 텍스트 코퍼스가 있습니다. 파이썬에서 Scipy를 사용하여 계층 적 클러스터링을 사용하여 관련 아티클의 클러스터를 생성하려고합니다. 이것은 내가 # Agglomerative Clustering import matplotlib.pyplot as plt import scipy.cluster.hierarchy

    -2

    1답변

    I 인스턴스에 대한 상이한 치수 여러 배열로 구성 파이썬 배열을 가지고 : KB=[[[1,2],[2,4],[2,4,5,3],[5,4,3,2,1]],[[1,2],[2,4],[2,4,5,3], [5,4,3,2,1]],........] 기본적으로, 그 어레이의 각 엔트리의 고정 된 수를 가지고 다른 차원 (첫 번째 항목은 2-D, 세 번째 항목은