0

기계 학습을 처음 접했고이 기본 질문이 있습니다. 알고리즘의 수학 부분이 약해서 이것을 이해하기 어렵습니다.자율 학습을 수행하는 동안 사용할 분류 자 ​​

자습서가없는 학습 (학습 샘플이 없음)을 사용하여 분류 자 ​​(선형 또는 비선형) 유형을 결정하는 방법 (간단하게 유지 - 2 클래스 분류 자) ? 우리가 이것을 모르는 경우, 기능 선택 (데이터 세트가 무엇인지 간접적으로 의미 함)에 대한 중요성이 매우 중요합니다. 나는 올바른 방향으로 생각하고 있거나 내가 알지 못하는 큰 것이있다. 이 주제에 대한 통찰력은 크게 감사하겠습니다.

답변

1

분류는 정의에 따라 "감독 학습"문제입니다. 그러한 모델은 클래스를 서로 분리하는 방법을 이해하기 위해 주어진 클래스 내의 포인트의 예를 필요로합니다. 레이블이 지정되지 않은 데이터 요소 간의 관계를 간단하게 찾는 경우 관리되지 않는 문제를 해결할 수 있습니다. 클러스터링 알고리즘을 살펴보십시오. k-means은 많은 사람들이 시작하는 곳입니다.

희망이 도움이됩니다.

0

이것은 큰 문제입니다. 그렇습니다. "클러스터링"이라는 용어는 인터넷 검색을위한 최고의 진입 점이지만, "훈련"은 매개 변수를 사용하여 목적 함수를 최적화하는 것을 의미하는 분류자를 훈련시키고 싶다는 것을 이해합니다. 첫 번째 선택은 차별 분류 자 ​​(예 : 선형 분류 자)가 아니기 때문에 표준 최대 가능도 (ML) 목적이 레이블없이 작동하지 않기 때문에 선형 분류 자와 같은 차별 분류 자입니다. 선형 분류자를 절대적으로 사용하려는 경우 ML 목표를 조정하거나 다른 목적 (분류 자 위험에 근접)을 사용하는 것이 좋습니다. 그러나보다 쉬운 선택은 HMM, Naive Bayes, Latent Dirichlet Allocation과 같은 생성 모델을 보는 것입니다. ML 대상은 레이블없이 작동합니다.