iMTE

4. Time series model identification and estimation 본문

Time-series Forecasting/ Prediction

4. Time series model identification and estimation

Wonju Seo 2021. 6. 22. 11:31

시계열 데이터를 분석해보면, 이전 포스팅처럼 복잡한 과정 없이 python 등의 툴을 사용하면 쉽게 계수를 추정해준다. 계수를 추정하기 전, 주어진 시계열 데이터가 정상성을 만족하는지, 또, 정상성을 만족한다면 어떤 모형을 선택해야 할지에 대한 의문이 있을 수 있다.

이전 포스팅에서 본 것처럼 AR과 MA 그리고 ARMA는 ACF, PACF의 형태를 바탕으로 시차 order를 확인할 수 있는데, 이를 identification이라고 한다. 시계열 모형의 식별은 다음의 순서를 통해 진행된다.

1) 시계열 데이터를 먼저 plot 해서, 정상성의 여부를 검토를 해야한다. 만약 추세 (trend)가 있거나, 계절성 (seasonality)가 있는 경우 이를 먼저 제거하는 것이 중요하다. 보통 추세를 제거할 때에는 differencing 방법을 사용한다.

2) 표본 ACF와 표본 PACF를 산출하고, 정상성 여부를 확인하고, 비정상적인 경우 다시 추세와 계절성을 제거하는 단계를 반복한다.

3) 표본 ACF와 표본 PACF의 형태를 바탕으로 ARMA 모형의 p와 q를 추정한다.

모형 표본 ACF 표본 PACF
AR(p) 지수적으로 감소하는 형태이거나, 진폭이 감소하는 sine 파 형태 시차 p 이후 cutoff
MA(q) 시차 q 이후 cutoff 지수적으로 감소하는 형태이거나, 진폭이 감소하는 sine 파 형태
ARMA(p,q) p>q : 처음부터 지수적으로 감소하거나 진폭이 감소하는 sine파 형태
p<q : q-p+1개에는 별도의 값을 갖고 그 이후에는 감소하는 형태
p>q : 처음 p-q+1개에는 별도의 값을 갖고 그 이후에는 감소하는 형태
p<q : 처음부터 지수적으로 감소하거나 진폭이 감소하는 sine파 형태

ARMA 모형의 경우 AR이 우세하거나 (즉, p>q) MA가 우세하거나 (즉, p<q)를 바탕으로 AR과 MA의 표본 ACF, PACF가 합쳐진 형태로 ACF와 PACF가 나타난 점을 유의해야한다.

4) 단계 3에서 얻은 모형의 계수를 추정한 다음, 잔차 (residual)을 구한다. 만약 잔차가 white noise를 따른다면, 모형을 제대로 식별한 것이며, 만약 그렇지않은 경우 p와 q를 추정하는 과정을 반복한다.

'Time-series Forecasting > Prediction' 카테고리의 다른 글

6. ARIMA model  (0) 2021.06.22
5. Time series model prediction  (0) 2021.06.22
3. ARMA model  (0) 2021.06.22
2. Stationary time series (Stationarity)  (0) 2021.06.22
1. Smoothing method (Evaluation metrics)  (0) 2021.06.22
Comments