2017-03-07 22 views
2

나는 LSTM 신경망 (stateful)을 사용하여 시계열 예측을하고있다.스테이트 풀 LSTM 신경 네트워크에서 시계열을 예측하는 올바른 방법입니까?

나는 상태 보존 형 LSTM이 숨겨진 패턴을 포착하고 만족스러운 예측을 할 수 있기를 바라고 있습니다 (시계열의 변화를 유발하는 물리적 법칙은 분명하지 않음).

나는 1500 (실제 관측 데이터)의 시간 시리즈 X을 가지고 있으며, 내 목적은 미래를 예측하는 것입니다. 100.

나는 다음 10가 다음 100을 예측하는 것보다 더 유망 할 것이라고 예측한다고 생각합니다. 맞습니까? 훈련 후

shape of trainX: [140, 100, 1] 
shape of trainY: [140, 10, 1] 
--- 
0: [x_0, x_1, ..., x_99] -> [x_100, x_101, ..., x_109] 
1: [x_10, x_11, ..., x_109] -> [x_110, x_111, ..., x_119] 
2: [x_20, x_21, ..., x_119] -> [x_120, x_121, ..., x_129] 
        ... 
139: [x_1390, x_1391, ..., x_1489] -> [x_1490, x_1491, ..., x_1499] 
--- 

, 내가 모델을 사용하려면 :;

그래서, 나는 (x_nX에서 n-th 요소를 나타냅니다 항상이 10 다음 예측하기 100 값을 사용)이 같은 훈련 데이터를 준비 다음 10 값을 예측하려면 을 [x_1400 - x_1499]으로 설정 한 다음 을 사용하여 값 [x_1510 - x_1519]을 예측하십시오.

올바른 방법인가요?

문서 및 예제를 많이 읽은 후에 모델을 훈련하고 예측할 수 있지만 결과는 만족스럽지 않습니다.

이 메서드를 확인하려면 100 (x_1400 - x_1499) 값을 알 수없는 것으로 가정하고 trainXtrainY에서 값을 제거한 다음 모델을 훈련시키고 예측하십시오. 마지막으로, 예측 된 값과 관측 된 값을 비교하십시오.

모든 의견이나 제안을 부탁드립니다.

시간 시리즈는 다음과 같습니다 enter image description here

+0

나는 단지 기이한데,이 기후 데이터입니까? –

+0

아닙니다. 천체 물리학적인 데이터입니다. :) @ RaphaelRoth – leftriver

+0

내 생각은 TSI (total solar irradiance) 또는 그와 비슷한 것을 생각했다. –

답변

3

귀하의 질문은 정말 복합되어있다. 내가 대답하려고 노력하기 전에 - 나는 너의 업무에 LSTM을 사용하는 것이 현명하다는 것을 너에게 의구심을 표한다. 비교적 진보 된 모델 (LSTM은 실제로 복잡한 패턴을 배울 수 있습니다)을 사용하여 비교적 쉽게 보이는 시계열을 원합니다. 게다가 - 당신은 정말로 작은 데이터를 가지고 있습니다. 솔직히 말해서, 나는 더 간단하고 쉬운 방법을 먼저 훈련 시키려고 노력할 것입니다 (예를 들어 ARMA 또는 ARIMA).

귀하의 질문에 대답하려면 - 귀하의 접근 방식이 좋은 경우 - 합리적인 것으로 보입니다. 다른 합당한 방법은 모두 100 단계 또는 예를 들어 50 두 번 단계. 10 단계를 사용하면 오류 누적이 발생할 수 있지만 여전히 좋은 방법 일 수 있습니다. 앞서 언급 한 바와 같이

는 - 차라리이 작업을 쉽게 ML 방법을 시도 할 수 있지만 정말 LSTM을 사용하려는 경우 당신은 다음과 같은 방법으로이 문제를 해결할 수 있습니다

  1. 앞서 단계의 번호와 같은 metaparameters 정의 당신은 네트워크에 공급되는 입력의 크기를 예측하고 싶습니다.
  2. 예 : 그리드 검색을 사용하여이 메타 매개 변수의 최적 값을 찾습니다. k-fold 교차 유효성 검사를 사용하여 각 설정을 평가하십시오.
  3. 최고의 메타 매개 변수 설정을 사용하여 최종 모델을 다시 배정하십시오.

비교적 적은 양의 데이터가 있으므로 하이퍼 매개 변수의 값을 쉽게 찾을 수 있습니다. 또한 접근 방식이 좋은지 아닌지를 알려주며 최적의 솔루션에서 제공하는 결과를 확인하십시오.

+0

대단히 고마워. 'stateful LSTM'을 사용하고자하는 이유는이 문제에서 아직 사용되지 않았기 때문이며, ARMA, ARIMA, normal neural networks 등의 방법이 이미 이전 연구자들에 의해 사용되어 왔기 때문입니다. 이전 결과는 모두 만족스럽지 않습니다. 따라서이 시계열에 대한 예측은 아직 해결되지 않은 문제로 남아 있습니다. – leftriver

+0

이 시계열의 변형은 장기 및 단기 원인 모두에 의해 좌우되지만 잘 모르지만 특정 법률은 분명하지 않습니다. LSTM의 '장기간 단기 기억력'이 법을 포착하고 미래를 예측할 수 있기를 희망합니다. 어쩌면 나는 너무 낙관적 일까? :) – leftriver

+0

시계열은 쉽게 보일 수 있지만 과학자들은 여전히 ​​다음 피크 (최대 값 및 날짜)를 예측할 수 없습니다. x 축은 시간이고 y 축은 0에서 수백까지의 물리량입니다. – leftriver