2017-12-20 40 views
0

SVM을 사용할 때의 전체 점은 알고리즘이 입력이 참인지 거짓인지 등을 결정할 수 있다는 것입니다.지원 벡터 머신 모델은 얼마나 구체적이어야합니까?

예측 유지 관리를 위해 SVM을 사용하여 시스템의 예상 가능성을 예측하려고합니다. 과열.

예를 들어, 범위는 0-102 ° C이고 온도가 80 ° C 이상이되면 고장으로 분류됩니다.

내 입력은 30 개의 double (마지막 30 개의 값) 배열입니다.

나는 SVM을 훈련시키기 위해 몇 가지 샘플 입력을하고 있는데, 훈련을 위해 매우 구체적인 데이터를 전달하는 것이 좋은지 궁금해했다. 예를 들어, 80 ° C, 81 ° C ... 102 ° C 모델이 자동으로이 값을 실패와 연관시킵니다. 당신은 30 x 79 ° C 배열을 할 수도 있고 통과시킬 수도 있습니다.

이렇게하면 어레이를 입력해도 온도가 80 -> 102 ° C 일 때 switch 문을 하드 코딩하는 것과 같지 않을 것입니다.

"하드 코드 된"스타일 배열을 전달하는 것이 좋습니까? 아니면 더 많은 임의 입력을 사용해야합니까?

+0

명확하지 않으며 광범위합니다. 추가로 : 만약 당신의 샘플 판독 값이 어느 시간 t에서 측정 된 온도라면, 그 측정 값을 통과시키고 SVM을 사용하는 것은 ML 관점에서 의미가 없습니다. – sascha

+0

그러나 확실히 가능합니다. 위의 설명에 따르면, 이것은 분류 알고리즘을 사용하는 이상한 문제로 보입니다. 특히 당신이 그 결과를 원하기 때문에, 플로트가 될 가능성은, 나는 추측하고 있습니다. – Alien13

+0

@ sascha 제 질문의 기술을 비판하기보다 제가 묻고 자하는 질문에 대한 답을 더 많이 고맙게 생각합니다. 그러나 두 번째 부분에 대한 의견을 기다립니다. – Andre

답변

1

가능성이있는 경우 Naive Bayes를 사용하는 것이 좋습니다. 그 방법이이 문제에 완벽하게 부합 할 수 있습니다. 그러나 SVM을 사용하도록 강요받는다면 다소 어려울 것입니다. 우선 SVM을 사용하는 주된 아이디어는 그것을 분류에 사용하는 것이고, 시나리오의 양은 별 문제가되지 않습니다. 그러나 입력은 거의 분리되어 있지 않으므로 일반적으로 무한한 시나리오가 있다고 생각합니다. 그러나 일반적으로 SVM을 구현하면 등급 분류 만 할 수 있습니다. 100 % 클래스가 1 % 1 % 2 % 2 %가 아니라면 문제가 해결되지 않습니다.

결론은 이것이 가능할 수 있지만 "모범 사례"로 간주되지는 않습니다. 100 개의 작은 하위 공간으로 나뉘어 진 30 차원 벡터 공간과 각 데이터 점을 상상할 수 있습니다. 30x1 벡터는 해당 벡터 공간의 한 점으로, 100 개의 하위 집합 중 어느 것이 속하는지에 따라 확률이 결정됩니다. 매우 깨끗하거나 불충분 한 데이터가 아니라면, 매우 열악한 성능의 모델로 이어질 것입니다.

환호 :