2016-12-24 20 views
0

나는 시계열 데이터 집합을 가지고 있는데, 이는 치수를 줄이기 위해 dft 신호로 변환하려고합니다. dft로 변환 한 후 k- 평균 알고리즘을 사용하여 결과로 얻은 dft 데이터 세트를 클러스터링하려고합니다.시계열 DFT 신호 클러스터링

dft 신호에는 허수가 포함되어 있기 때문에 어떻게 하나의 신호를 클러스터링 할 수 있습니까?

답변

0

벡터에서 허수 부 분을 다른 구성 요소로 쉽게 처리 할 수 ​​있습니다. 다른 응용 프로그램에서는 무시하고 싶을 것입니다!

하지만 다른 심각한 문제에 직면하게 될 것입니다.

데이터 마이닝 및 클러스터링은 특히 appliyng function a (dft)와 function b (k-means)만큼 쉽지 않으며 그 결과가 있습니다. 죄송합니다. 이는 탐색적인 데이터 마이닝이 작동하는 방식이 아닙니다.

우선, 많은 시간 계열에 대해 DFT가 전혀 도움이되지 않습니다. 다른 사람들은 먼저 적절한 리샘플링 또는 세분화를 수행하거나 계절성과 같은 흥미로운 결과를 제거해야합니다. DFT가 작동하더라도 샘플링 빈도 또는 일부 간섭과 같은 아티팩트를 강조 할 수 있습니다.

그러면 중요한 문제가 발생할 것입니다. k-means는 모든 속성이 동일한 중요성을 갖는다는 가정에 기반합니다. 그리고 DFT는 반대 개념에 기반을두고 있습니다. 첫 번째 구성 요소는 신호의 대부분을 캡처하고 나중에 구성 요소는 약간의 편차를 갖습니다 (이는 치수 감소로이를 사용하기위한 동기입니다). 그래서이 직관에 기초하여, 결코 일 수는 없습니다.은 DFT 계수에 k- 평균을 적용해야합니다. 동시에 데이터 마이닝은 "통계적으로 말도 안되는"appfoaches가 유용한 결과를 제공 할 수 있다는 것을 반복적으로 보여주었습니다 ... 따라서 시도 할 수는 있지만 결과를주의 깊게 확인하고 지나치게 열정적이거나 낙관적 인 태도를 취하지 않도록하십시오.

+0

저의 연구 목표는 클러스터링 및 분류와 같은 데이터 마이닝 작업을 수행 할 수있는 순서에 따라 서로 다른 시계열 차원 감소 기술을 벤치마킹하는 것입니다. – user1143110

+0

나는 반드시 DFT 기술에 대한 가이드를 따를 것이다. – user1143110

0

FFT를 사용하면 데이터 세트를 dft 신호로 변환합니다. 각 작은 데이터 세트에 대해 DFT를 계산하는 데 도움이됩니다.