2017-02-13 17 views
0

저는 datascience를 처음 사용하기 때문에 k- 평균 (또는 모든) 클러스터링 알고리즘에 대해 이론적 인 질문이 있습니다. 이 순간 나는 행동 데이터를 기반으로 고객 세분화를 시도하고 있습니다. 고객이 판매 제품, 을 구입 비율 - - 시간 당 제품의 평균 수 - 제품 당 평균 가격 - 여러 사람 - 상점 에서 제품을 구입하는 주파수 : 우리는 같은 몇 가지 특성을 설계했다.클러스터링을 통한 고객 세분화

우리가 이루고자하는 목표는 서로 같이 행동하는 고객 그룹입니다. 따라서 우리는 선호도에 따라 고객과 소통 할 수 있습니다. 문제는 클러스터링 결과로 우리가 작업 할 수있는 적절한 세그먼트를 제공하는지 확신 할 수 없다는 것입니다. 아마도 그것은 비슷한 행동에 좋지만 실용적인 용도가 아닌 다른 클러스터를 결정할 것입니다.

제 질문은 다음과 같습니다. 목표 변수를 결정할 수 있도록 분류 알고리즘을 사용하는 것이 더 좋을까요, 아니면 클러스터링 알고리즘을 사용해야합니까? 그리고 클러스터링 알고리즘을 선택해야한다면, 결과의 방식을 조금 더 제어 할 수 있도록 속성의 수를 줄이는 것이 더 낫겠습니까?

여러분이이 개념적 문제를 도와 주길 바랍니다.

답변

0

수 있습니다 사용 분류, 그럼 항상 분류를 사용하십시오.

클러스터링은 취약하고 잘 정의 된 문제가 아닙니다. 클러스터링 알고리즘에 비즈니스를 구축하고 싶지는 않습니다.