sklearn을 사용하여 응집 클러스터링을 시도하고 있습니다. 피팅 단계에서이 오류가 발생합니다. 오류가 항상 나타나지 않습니다. 데이터 포인트의 수를 변경하면 오류 및 응집 클러스터링이 발생하지 않을 수 있습니다. 나는 이것을 디버깅하는 방법을 너무 확신하지 못한다. 이미 fillnan을 사용하여 데이터 배열에 NaN 값이 없다는 것을 확인했습니다. 왜 이런 일이 일어날 지에 대한 아이디어가 도움이 될 것입니다.sci-kit agglomerative 클러스터링 오류를 학습하십시오.
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-38-8acbe956f76e> in <module>()
13 agg = AgglomerativeClustering(n_clusters=k,affinity="euclidean",linkage="ward")
14 init = time.time()
---> 15 agg.fit(data)
16 atime = time.time()
17 labels = agg.labels_
C:\Python27\lib\site-packages\sklearn\cluster\hierarchical.pyc in fit(self, X, y)
754 n_components=self.n_components,
755 n_clusters=n_clusters,
--> 756 **kwargs)
757 # Cut the tree
758 if compute_full_tree:
C:\Python27\lib\site-packages\sklearn\externals\joblib\memory.pyc in __call__(self, *args, **kwargs)
279
280 def __call__(self, *args, **kwargs):
--> 281 return self.func(*args, **kwargs)
282
283 def call_and_shelve(self, *args, **kwargs):
C:\Python27\lib\site-packages\sklearn\cluster\hierarchical.pyc in ward_tree(X, connectivity, n_components, n_clusters, return_distance)
189 'for the specified number of clusters',
190 stacklevel=2)
--> 191 out = hierarchy.ward(X)
192 children_ = out[:, :2].astype(np.intp)
193
C:\Python27\lib\site-packages\scipy\cluster\hierarchy.pyc in ward(y)
463
464 """
--> 465 return linkage(y, method='ward', metric='euclidean')
466
467
C:\Python27\lib\site-packages\scipy\cluster\hierarchy.pyc in linkage(y, method, metric)
662 Z = np.zeros((n - 1, 4))
663 _hierarchy.linkage(dm, Z, n,
--> 664 int(_cpy_euclid_methods[method]))
665 return Z
666
scipy\cluster\_hierarchy.pyx in scipy.cluster._hierarchy.linkage (scipy\cluster\_hierarchy.c:8759)()
C:\Python27\lib\site-packages\scipy\cluster\_hierarchy.pyd in View.MemoryView.memoryview_copy_contents (scipy\cluster\_hierarchy.c:22026)()
C:\Python27\lib\site-packages\scipy\cluster\_hierarchy.pyd in View.MemoryView._err_extents (scipy\cluster\_hierarchy.c:21598)()
ValueError: got differing extents in dimension 0 (got 704882705 and 4999850001)
Google에서 사용할 수있는 최소한의 예가 있습니까? – edwinksl