2016-11-09 3 views
1

아주 기본적인 질문 :scikit learn/pandas/python을 사용하여 어느 한 클러스터의 샘플/관측치/행을 인쇄하는 방법?

하나의 클러스터에 귀속 된 관측치를 어떻게 인쇄합니까?

data = pd.read_csv('my_file.csv') 
X = data[['Var1','Var2','Var3']] 
ms = MeanShift() 
ms.fit(X) 
labels = ms.labels_ 
cluster_centers = ms.cluster_centers_ 

난 그냥 'VAR1'의 값을보고 싶어요 '변수 2를 대입 할 때 변수', 어떤 하나 개의 클러스터에 대한 'VAR3'.

답변

2

데이터 세트에 대한 예측을보고 싶은 것 같습니다. 예를 들어,

df['y_pred'] = y_pred 

을 원하는대로 dataframe를 필터링 :

y_pred = ms.predict(X) 

그런 다음 이렇게하여 샘플이를 연결할 수 있습니다 : 다음과 같이 수행 할 수 있습니다 클러스터 1의 샘플을 보려면

df[df.y_pred == 1] 
+0

위대한 생각입니다. –