'2021/06/22 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2021/06 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록2021/06/22 (6)

iMTE

6. ARIMA model

AR, MA, ARMA는 정상성을 만족하는 시계열에서 시계열 데이터를 표현하는데 사용되었던 모델이다. 하지만, 실제 시계열 데이터를 보자면, 많은 데이터들이 비정상적인 특징을 갖고 있음을 확인 할 수 있다. 추세가 있거나 계절성 등이 포함되어 있는데, 이런 정보들은 간단히 시계열 데이터를 plot 해보면 알 수 있다. 이런 시계열 데이터에서 표본 ACF를 구하면 시차에 대해서 매우 서서히 감소하는 형태를 확인 할 수 있는데, 이는 잘못된 모형 identification으로 이어질 수 있다. 1) 시계열 데이터에서 추세가 있는 경우 간단하게 differencing을 통해서 추세를 제거할 수 있다. 1차 차분은 다음과 같이 표현된다. $\Delta Z_t = Z_t-Z_{t-1}=(1-B)Z_t$ d차 차분..

Time-series Forecasting/ Prediction 2021. 6. 22. 17:03

5. Time series model prediction

특정 시계열 데이터가 주어졌고, 추세, 계절성을 제거하여 정상성을 만족하는 시계열로 변환을 하였을 때, 표본 ACF와 표본 PACF를 바탕으로 ARMA의 p,q 를 추정한다. 이렇게 추정된 ARMA 모형은 이전 값을 갖고 예측을 할 수 있다. 예측과 관련되서, 시계열 모델은 예측을 위한 모델이라기 보다는 주어진 시계열 데이터를 잘 설명할 수 있는 모델이라고 보는 시각이 옳은 것으로 생각된다. 이후의 예측은 주어진 과거 데이터를 잘 설명하는 모델로 부터 앞으로 가장 나타날 그럴 듯한 현상에 대해 정보를 제공해 주고, 사용자는 이 정보를 바탕으로 앞으로 어떤 선택을 할지 도움을 받을 수 있다. 먼저, 시점 n 까지의 시계열 관측치로부터 1 step 이후의 예측치를 $f_{n,1}$로 나타내자. 만약에 k s..

Time-series Forecasting/ Prediction 2021. 6. 22. 16:04

4. Time series model identification and estimation

시계열 데이터를 분석해보면, 이전 포스팅처럼 복잡한 과정 없이 python 등의 툴을 사용하면 쉽게 계수를 추정해준다. 계수를 추정하기 전, 주어진 시계열 데이터가 정상성을 만족하는지, 또, 정상성을 만족한다면 어떤 모형을 선택해야 할지에 대한 의문이 있을 수 있다. 이전 포스팅에서 본 것처럼 AR과 MA 그리고 ARMA는 ACF, PACF의 형태를 바탕으로 시차 order를 확인할 수 있는데, 이를 identification이라고 한다. 시계열 모형의 식별은 다음의 순서를 통해 진행된다. 1) 시계열 데이터를 먼저 plot 해서, 정상성의 여부를 검토를 해야한다. 만약 추세 (trend)가 있거나, 계절성 (seasonality)가 있는 경우 이를 먼저 제거하는 것이 중요하다. 보통 추세를 제거할 때에..

Time-series Forecasting/ Prediction 2021. 6. 22. 11:31

3. ARMA model

이전 포스팅에서 정상성 시계열은 AR과 MA로 나타낼 수 있음을 설명하였다. 이번 포스팅에는 AR, MA 모형을 각각 설명하고 이 두개가 합친 ARMA 모형에 대해서 소개하고자한다. 먼저, AR의 기본적인 형태는 다음과 같다. $Z_t=\phi_1 Z_{t-1}+a_t$ 위 식에서 $\phi$는 정상성 조건을 만족시키며, $a_t$는 평균이 0, 분산이 $\sigma^2$을 갖는 white noise 이다. 위 식은 시차 1의 과거 값에 영향을 받음으로, AR(1) 모형이라고 부른다. 만약 시차 p인 AR(p) 모형은 다음과 같이 표현된다. $Z_{t}=\phi_1 Z_{t-1}+\phi_2 Z_{t-2}+...+\phi_p Z_{t-p}+a_t$ 위 식에서 $\phi$는 정상성 조건을 만족시킨다. 간단..

Time-series Forecasting/ Prediction 2021. 6. 22. 10:54

2. Stationary time series (Stationarity)

보통 시계열분석에서 stationary 시계열을 다루며, non-stationary 시계열은 여러 변환 (예, differentiation) 들을 통해서 정상적인 시계열으로 바꾼 이후에 분석을 한다. 1) 강정상성, strong stationary ($Z_1,...,Z_m$)과 ($Z_{1+k},...,Z_{m+k}$) ($k>1$)이 동일한 결합확률분포를 가질 때 strong stationry 시계열이라고 한다. 2) 위의 조건을 만족할 경우 다음 성질을 갖는다. (1) $E[Z_t]=\mu, t\geq 1$ (2) $Var[Z_t]=\sigma^2=\gamma (0), t\geq 1$ (3) $Cov[Z_t,Z_{t-k}]=Cov[Z_{t+k},Z_t]=\gamma (k), t\geq 1$ (자기공분..

Time-series Forecasting/ Prediction 2021. 6. 22. 10:18

1. Smoothing method (Evaluation metrics)

모델을 만들어 낸 다음에, 모델의 예측 성능을 평가하기 위해서는 예측성능 척도가 필요하다. 먼저, error는 다음과 같이 정의가 된다. $$e_{t,1}=X_{t+1}-f_{t,1}$$ 위 식에서, $X_{t+1}$은 t+1 시점의 실제 값이고, $f_{t,1}$은 t 시점에서 모델에 의해 예측된 t+1 값을 의미한다. 만약 여러개의 관측치에 대한 예측 오차를 계산할 때, 4개의 예측 성능 척도가 사용된다. 1) Mean squared error (MSE) 2) Root mean squared error (RMSE) 3) Mean absolute deviation (MAD) 4) Mean absolute percent error (MAPE) 위 척도는 다음과 같은 수식으로 나타낼 수 있다. $MSE=\..

Time-series Forecasting/ Prediction 2021. 6. 22. 09:49

Prev 1 Next

목록2021/06/22 (6)

iMTE

티스토리툴바