0

저는 연구에서 데이터 소스에 큰 어려움에 직면하고 있습니다. 기본적으로 나는 후 처리를 위해 등록 된 여섯 가지 유형의 이벤트가 있습니다. 이 이벤트는 프로세스에서 사용되는 일종의 이온 및 장치에서 이벤트가 발생하는 위치와 관련됩니다. 이미지 1은 각 유형의 짝수에 대한 평균 곡선을 보여줍니다.시계열 분류에 올바른 매개 변수 선택

이미지 1

Image 1 Average curves

내 목표는 내가 각각의 곡선으로부터 추출 된 네 개의 매개 변수 사용하고 곡선을 연구하기 위해,이 곡선을 찾고 이온의 종류를 분류 할 수 있습니다 : peak value [max value], middle length[red line]Rising time[green]Base length [ blue], 이미지의 표시로 2

이미지 2

0 내가 곡선, K-meansLDA을 분류하려고하는 알고리즘의 두 가지 유형을 사용하고 있지만,이 순간에 결과가 명확하지 않다

Features extracted

, 내가 좋은 클러스터와 분류가없는, 또한 나는 SOM 실행 알고리즘 및 더 나은 결과를 얻을 수 있지만 매우 statisfactory. 나는 매개 변수가 좋은 선택이 아니라고 믿는다. 좋은 매개 변수를 잘 나타내려면 어떻게해야합니까? 분류기에 적합한 매개 변수를 선택하려면 어떻게해야합니까? 이 경우에 사용할 좋은 방법이 있습니까?

+0

커브 피팅에 왜이 네 가지 매개 변수를 사용하는지 설명하지 않았습니다. 장치의 사전 정의 된 출력입니까? 기본적으로 네 가지 제약 조건이 있으므로 효과적으로 3 차 다항식을 사용할 수 있습니다. 하지만 내 안구에 따르면, 최소한 보여준 작은 데이터 세트에 대해서는 2 차 다항식으로도 충분할 것 같습니다. –

+0

@TomAnderson,이 이벤트를 분류하기위한 모델을 얻으려고합니다. 첫 번째 방법은 이러한 매개 변수를 추출하여이 매개 변수와 이벤트 유형 간의 상관 관계를 찾기 위해 클러스터링 알고리즘에 값을 적용하는 것이 었습니다. 내 문제는 이제 어떻게 분류 프로세스에 대한 이러한 매개 변수의 품질을 측정 할 수 있습니까? – JulianOliveira

답변

0

계속 진행하는 한 가지 방법은 두 가지를 비교하는 실험을 고안하는 것입니다. 예를 들어 매개 변수가 좋은지 궁금 할 수 있습니다. 4 개의 고정 시간 간격 (예 : 20ms, 30ms, 40ms 및 50ms의 진폭)에서 진폭과 같은 다른 4 가지 매개 변수 세트를 사용해보십시오. 원래 세트의 매개 변수를 새 세트와 비교할 때 테스트 조건에 대해 다른 방법보다 한 가지 방법이 더 나은 결과가 표시됩니다. 어쩌면 한 세트가 분류 작업에 대해 다른 정보와 관련된 정보를 제공 할 수 있습니다.

여기에는 알려진 분류의 데이터가 있다고 가정합니다. 테스트 세트와는 별도로 다른 트레이닝 세트를 사용하는 것이 가장 좋습니다.

또는 실험이 kmeans vs LDA 인 경우 어떤 것이 더 효과적입니까? 얼마나 좋아 졌니? 왜 그런지 알아?

이 마지막에는 두 가지를 비교하는 많은 실험이 있습니다. 결과를 설명하는 데 도움이 될 수 있습니다.