저는 연구에서 데이터 소스에 큰 어려움에 직면하고 있습니다. 기본적으로 나는 후 처리를 위해 등록 된 여섯 가지 유형의 이벤트가 있습니다. 이 이벤트는 프로세스에서 사용되는 일종의 이온 및 장치에서 이벤트가 발생하는 위치와 관련됩니다. 이미지 1은 각 유형의 짝수에 대한 평균 곡선을 보여줍니다.시계열 분류에 올바른 매개 변수 선택
이미지 1
내 목표는 내가 각각의 곡선으로부터 추출 된 네 개의 매개 변수 사용하고 곡선을 연구하기 위해,이 곡선을 찾고 이온의 종류를 분류 할 수 있습니다 : peak value [max value]
, middle length[red line]
을 Rising time[green]
및 Base length [ blue]
, 이미지의 표시로 2
이미지 2
0 내가 곡선,K-means
및
LDA
을 분류하려고하는 알고리즘의 두 가지 유형을 사용하고 있지만,이 순간에 결과가 명확하지 않다
, 내가 좋은 클러스터와 분류가없는, 또한 나는 SOM
실행 알고리즘 및 더 나은 결과를 얻을 수 있지만 매우 statisfactory. 나는 매개 변수가 좋은 선택이 아니라고 믿는다. 좋은 매개 변수를 잘 나타내려면 어떻게해야합니까? 분류기에 적합한 매개 변수를 선택하려면 어떻게해야합니까? 이 경우에 사용할 좋은 방법이 있습니까?
커브 피팅에 왜이 네 가지 매개 변수를 사용하는지 설명하지 않았습니다. 장치의 사전 정의 된 출력입니까? 기본적으로 네 가지 제약 조건이 있으므로 효과적으로 3 차 다항식을 사용할 수 있습니다. 하지만 내 안구에 따르면, 최소한 보여준 작은 데이터 세트에 대해서는 2 차 다항식으로도 충분할 것 같습니다. –
@TomAnderson,이 이벤트를 분류하기위한 모델을 얻으려고합니다. 첫 번째 방법은 이러한 매개 변수를 추출하여이 매개 변수와 이벤트 유형 간의 상관 관계를 찾기 위해 클러스터링 알고리즘에 값을 적용하는 것이 었습니다. 내 문제는 이제 어떻게 분류 프로세스에 대한 이러한 매개 변수의 품질을 측정 할 수 있습니까? – JulianOliveira