cluster-analysis

    -1

    1답변

    으로 원래 클러스터 센터/무게 중심을 얻을 나는 결과를 다시 작성하는 K-수단 모델 val kmeans = new KMeans().setK(k).setSeed(1L) val model = kmeans.fit(train_dataset) 다음 추출 클러스터 센터 (무게 중심) var clusterCenters:Seq[(Double,Double,Double

    0

    1답변

    Java 프로젝트에서 ELKI에서 제공하는 k-means 구현 중 하나를 사용하고 있습니다. 실제로 k- 평균을 실행하기 전에 최소 최대 정규화를 실행하고 싶지만 라이브러리 API를 사용하여 올바른 방법을 이해할 수 없습니다. 누군가 올바른 방향으로 나를 가리킬 수 있습니까? filterlist가 List<ObjectFilter>이고 AttributeWis

    0

    1답변

    시간 순서에 대한 이상 탐지에서 새로운 것이므로 내 질문에 대해 분명히 알 수 있습니다. 오늘, 나는 시간 순서에 이상을 감지하기 위해 lstm과 클러스터링 기법을 사용하고있다. 그러나 그 방법은 시간이 지남에 따라 천천히 악화되는 예외를 식별 할 수 없다 (나는 추세라고 불렀다고 생각한다). 즉, 기계의 온도가 천천히 한 달에 증가한다 (lstm은 이 추

    -2

    1답변

    모든 문서에서 각 토큰에 대해 tf * idf를 계산하고 각 문서에 대해 벡터를 생성했습니다 (n 차원, n은 각각 코퍼스의 고유 단어 수입니다). sklearn.cluster.MeanShift를 사용하여 벡터에서 클러스터를 작성하는 방법을 파악할 수 없습니다.

    -1

    1답변

    나는 미국 데이터에 대해 세분화를 실행했다. 유사한 클러스터 할당을 (시작 솔루션으로) 다른 시장에 어떻게 적용 할 수 있습니까? 미국과 다른 시장 모두 정확한 입력과 조사가 있습니다. 여기 내 코드는 다음과 같습니다 TwoStepCluster <-function(xdata, k, method="ward.D2", factor=FALSE) { if

    0

    2답변

    K-means ++ 클러스터링의 적합도를 찾는 방법으로 입력이 각 클러스터에 얼마나 많은 비율로 정렬되는지 보여줍니다. 예를 들어, 입력 A는 0.4의 경우 클러스터 1이고 0.6의 경우 클러스터 2입니다.

    0

    1답변

    나는 012M을 클러스터링하기 위해 from pyspark.ml.clustering import KMeans 라이브러리를 사용한다. 내가 클러스터가 단지 10 시간 이동하고 더 이상 10 번 이동 보장합니다. 어떤 매개 변수를 사용해야합니까? 나를 위해, 나는 그것이 maxIter=10이어야한다라고 생각한다. 그러나 확실하지 않다. 어느 것이 최고입니까?

    0

    1답변

    나는 (드문 드문 한 용어를 제거한 후) 세 개의 문서에 약 1140 개의 용어가 있습니다. 클러스터에 대한 정보를 갖고 싶습니다. 첨부 된 그림과 같이 클러스터를 생성했지만 읽을 수는 없습니다. k-mean 클러스터를 시도했지만 동일한 문제가 계속 발생합니다. 나는 모든 용어에 관심이 많지는 않지만 명확하게 정의 된 클러스터가 3 ~ 4 개 밖에 없다는

    0

    2답변

    나는 위도, 경도 및 시간 스탬프로 구성된 n 개의 위치 목록을 가지고 있습니다. 이 위치는지도에 고정됩니다. 그러나 인접한 위치를 가장 최근에 변경된 위치를 중심으로 그룹화하여지도에 핀이 넘치지 않도록해야합니다. 내 초기 생각은 다음과 같습니다 타임 스탬프에 의해 정렬 위치 사람들을 선택 가 최신 위치까지의 거리를 계산 N-1의 위치를 ​​최신 위치 를

    0

    1답변

    나는 Wikipedia 기사의 모음집을 가지고 있습니다. 나는 10,000 개의 가장 빈번한 단어를 확인하고 Word2Vec 벡터를 찾고 구형 k- 평균을 벡터에 사용하여 유사성을 기준으로 단어를 500 개의 그룹으로 묶었습니다. 단어 클러스터 중 3 개를 골라 단어를 단어 벡터로 다시 변환했습니다. 각 단어 벡터는 300 개의 값으로 구성된 배열이므로 모