데이터 세트가 여러 개 있고 각 데이터 세트에는 다소 바나나 모양의 영역과 고밀도 모양의 영역이 있습니다. . DBSCAN 알고리즘을 사용하여이 영역을 나머지 데이터와 차별화 할 수 있었지만, 감독 된 알고리즘을 사용하여 어떤 클러스터가 바나나인지 알 수 있었고 어느 두 클러스터가 고밀도 BLOB인지, 그리고 나는 어디서부터 시작해야할지 모르겠습니다.감독 된 기계 학습 : 모양과 밀도 (파이썬)를 기반으로 데이터 클러스터 유형 분류
3 가지 카테고리 (바나나, 블롭, 둘 다 아님)가 있으므로 최상의 접근 방식 (바나나 또는 바나나인지, 블롭인지 블롭인지 평가)은 두 가지 별도의 로지스틱 회귀 분석을 수행할까요? 또는 세 가지 범주를 하나의 신경망에 통합하는 좋은 방법이 있습니까?
여기에는 세 가지 데이터 세트가 있습니다. 각각 바나나는 빨간색입니다. 첫 번째 경우, 두 개의 얼룩은 녹색과 파란색이고, 두 번째 얼룩은 청록색과 녹색이며, 세 번째 얼룩은 파란색과 녹색입니다. 나는 그들에게 내가 코드를 실행할 때마다 선택 손을하지 않아도 난 후 바나나와 방울 지역에 레이블을, 지금 즉 차별화 한 다른 지역 (에 프로그램을하고 싶습니다.
Z 축의 크기가 다른 점은 다른 축보다 결과에 미치는 영향이 적음을 유의하십시오. –
모든 모델에서 그렇습니다. 의사 결정 트리는 규모를 신경 쓰지 않으며 클러스터 **를 분류하는 데 문제가되므로이 기하도 중요하지 않습니다. 일부 기하학적 특징으로 전체 집합을 표현해야하므로 여기서는 그렇지 않습니다. . – lejlot