cluster-analysis

-1열

1답변

으로 원래 클러스터 센터/무게 중심을 얻을 나는 결과를 다시 작성하는 K-수단 모델 val kmeans = new KMeans().setK(k).setSeed(1L) val model = kmeans.fit(train_dataset) 다음 추출 클러스터 센터 (무게 중심) var clusterCenters:Seq[(Double,Double,Double

0열

1답변

ELKI : k-means를 실행하기 전에 min-max 정규화를 수행하십시오.

Java 프로젝트에서 ELKI에서 제공하는 k-means 구현 중 하나를 사용하고 있습니다. 실제로 k- 평균을 실행하기 전에 최소 최대 정규화를 실행하고 싶지만 라이브러리 API를 사용하여 올바른 방법을 이해할 수 없습니다. 누군가 올바른 방향으로 나를 가리킬 수 있습니까? filterlist가 List<ObjectFilter>이고 AttributeWis

0열

1답변

시간 변화에 따른 변화 (추세)의 시간 순서에 따른 오류 감지

시간 순서에 대한 이상 탐지에서 새로운 것이므로 내 질문에 대해 분명히 알 수 있습니다. 오늘, 나는 시간 순서에 이상을 감지하기 위해 lstm과 클러스터링 기법을 사용하고있다. 그러나 그 방법은 시간이 지남에 따라 천천히 악화되는 예외를 식별 할 수 없다 (나는 추세라고 불렀다고 생각한다). 즉, 기계의 온도가 천천히 한 달에 증가한다 (lstm은 이 추

-2열

1답변

Mean Shift를 사용한 문서 클러스터링

모든 문서에서 각 토큰에 대해 tf * idf를 계산하고 각 문서에 대해 벡터를 생성했습니다 (n 차원, n은 각각 코퍼스의 고유 단어 수입니다). sklearn.cluster.MeanShift를 사용하여 벡터에서 클러스터를 작성하는 방법을 파악할 수 없습니다.

-1열

1답변

시작 솔루션을 사용하는 Hclust

나는 미국 데이터에 대해 세분화를 실행했다. 유사한 클러스터 할당을 (시작 솔루션으로) 다른 시장에 어떻게 적용 할 수 있습니까? 미국과 다른 시장 모두 정확한 입력과 조사가 있습니다. 여기 내 코드는 다음과 같습니다 TwoStepCluster <-function(xdata, k, method="ward.D2", factor=FALSE) { if

0열

2답변

Python에서 Kmeans ++ 클러스터링의 적합도를 찾는 방법

K-means ++ 클러스터링의 적합도를 찾는 방법으로 입력이 각 클러스터에 얼마나 많은 비율로 정렬되는지 보여줍니다. 예를 들어, 입력 A는 0.4의 경우 클러스터 1이고 0.6의 경우 클러스터 2입니다.

0열

1답변

클러스터 이동 수정 PySpark

나는 012M을 클러스터링하기 위해 from pyspark.ml.clustering import KMeans 라이브러리를 사용한다. 내가 클러스터가 단지 10 시간 이동하고 더 이상 10 번 이동 보장합니다. 어떤 매개 변수를 사용해야합니까? 나를 위해, 나는 그것이 maxIter=10이어야한다라고 생각한다. 그러나 확실하지 않다. 어느 것이 최고입니까?

0열

1답변

텍스트 마이닝에서 클러스터 표현을위한 더 나은 클러스터 덴 드로 그램 R

나는 (드문 드문 한 용어를 제거한 후) 세 개의 문서에 약 1140 개의 용어가 있습니다. 클러스터에 대한 정보를 갖고 싶습니다. 첨부 된 그림과 같이 클러스터를 생성했지만 읽을 수는 없습니다. k-mean 클러스터를 시도했지만 동일한 문제가 계속 발생합니다. 나는 모든 용어에 관심이 많지는 않지만 명확하게 정의 된 클러스터가 3 ~ 4 개 밖에 없다는

0열

2답변

알고리즘 -지도상의 위치 그룹화

나는 위도, 경도 및 시간 스탬프로 구성된 n 개의 위치 목록을 가지고 있습니다. 이 위치는지도에 고정됩니다. 그러나 인접한 위치를 가장 최근에 변경된 위치를 중심으로 그룹화하여지도에 핀이 넘치지 않도록해야합니다. 내 초기 생각은 다음과 같습니다 타임 스탬프에 의해 정렬 위치 사람들을 선택 가 최신 위치까지의 거리를 계산 N-1의 위치를 최신 위치 를

0열

1답변

단어 클러스터링을위한 PCA 및 K- 평균

나는 Wikipedia 기사의 모음집을 가지고 있습니다. 나는 10,000 개의 가장 빈번한 단어를 확인하고 Word2Vec 벡터를 찾고 구형 k- 평균을 벡터에 사용하여 유사성을 기준으로 단어를 500 개의 그룹으로 묶었습니다. 단어 클러스터 중 3 개를 골라 단어를 단어 벡터로 다시 변환했습니다. 각 단어 벡터는 300 개의 값으로 구성된 배열이므로 모