2017-10-16 19 views
0

범주/하위 범주가있는 15 개의 레코드가있는 csv 파일이 있습니다.sqldf : 범주를 기반으로 하위 범주를 그룹화하는 방법

열 : 나는 파이썬 팬더를 사용하여 시도 Sub_cat1,50

을 분류하고 위의 결과를 얻었다 : Main_category, Sub_category,
원하는 결과를 계산

test = pd.DataFrame(df.groupby(['Main_category','Sub_category']['Sub_category'].count()) 

내가하려고를 R에서 sqldf를 사용하여 동일하게 달성하지만 카테고리에 대한 각 하위 카테고리의 수를 얻지는 않습니다. 당신이 순서대로 모두 집계 치수, Main_categorySub_category에 의해 그룹으로도 대부분의 SQL 언어로 컴파일 할 수있는 SQL 쿼리를 가지고있는 것처럼

sqldf("select Main_category, Sub_category, count(*) from MyData group by Main_category") 
+0

검토해주십시오. [mcve] –

+0

'group by Main_category'를 (를) 'Main_category, Sub_category별로 그룹화'로 변경하십시오. – Gregor

답변

2

나는 단순한 SQL 쿼리를 보면, 보인다 : 그것은 단지 총 수를 표시 :

sqldf("select Main_category, Sub_category, count(*) from MyData group by Main_category, Sub_category")