iMTE

1. Smoothing method (moving average) 본문

Time-series Forecasting/ Prediction

1. Smoothing method (moving average)

Wonju Seo 2020. 1. 1. 15:58

1. Smoothing method (moving average)

1) 분석

보통 시계열의 데이터는 noisy한 경우가 있다. Noisy한 데이터를 보면 어느 시간에서 드러나는 계절성과 패턴을 파악하는 것이 어렵다. 따라서, noisy한 데이터를 제거함으로써 시계열의 시간에 따른 패턴을 파악하는 것이 필요하다. 보통 moving average와 exponential smoothing 방법이 사용된다. 가장 먼저, moving average에 대한 개념부터 파악해보자. 먼저 시계열 X가 horizontal pattern을 갖는다고 가정하면, simple moving average는 다음과 같이 계산된다.

a는 white noise로 평균이 0이고 표준편차가 sigma인 normal distribution을 따른다고 하면, 위와 같이 simple moving average가 계산된다. 더 나아가, simple moving average의 기대값과 분산을 구해보면 다음과 같다.

Simple moving average의 분산이 본 시계열 분산의 1/N 배임을 알 수 있다. 즉, 데이터의 분산이 감소되는 것임으로, smoothing 효과가 있음을 확인할 수 있다. 하지만, 만약 N이 너무 크면 갑작스럽게 변화하는 변화를 따라갈 수 없어 적절한 N을 선택해야 한다. 위의 식을 바탕으로 c를 다음과 같이 추정할 수 있다.

두번째로, 시계열 X가 linear trend를 갖는 다고 하면, double moving average는 다음과 같이 계산된다. Double moving average를 계산함으로써, linear trend에 대한 기대값을 계산할 수 있다. 즉, horizontal pattern은 simple moving average만, linear trend에서는 simple, double moving average를 계산해야한다.

더 나아가, double moving average의 기대값을 계산하면 다음과 같다.

위 두 식에서, 다음 두 식을 얻을 수 있다.

즉, 시계열 값의 기대치와 simple moving average의 기대치의 차이와 simple moving average와 double moving average의 차이가 동일하며 이 값은 위와 같이 계산되는 것임을 알 수 있다. 위의 4개의 식을 연립하면 시계열 X의 c와 b를 다음과 같이 추정할 수 있다.

2) 예측

먼저, 시계열 X가 horizontal pattern을 갖는 경우, 다음과 같이 예측값과 예측 분산을 계산할 수 있다.

직관적으로, X가 horizontal pattern을 갖기 때문에, 미래의 예측 값은 추정된 c와 같을 것이다. 두번째로, 시계열 X가 linear trend를 갖는 경우, 다음과 같이 예측값을 계산할 수 있다.

직관적으로, X가 linear trend를 갖기 때문에, 미래의 예측 값은 추정된 c와 추정된 b에 시간을 곱한 값과 같을 것이다.


Comments