일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Cam
- Explainable AI
- 머신러닝
- AI
- 인공지능
- 코딩테스트
- Score-CAM
- python
- Unsupervised learning
- 설명가능한
- 설명가능한 인공지능
- 기계학습
- keras
- Machine Learning
- 메타러닝
- grad-cam
- 딥러닝
- meta-learning
- 백준
- SmoothGrad
- 시계열 분석
- cs231n
- GAN
- Class activation map
- Artificial Intelligence
- 코딩 테스트
- coding test
- Deep learning
- xai
- Interpretability
- Today
- Total
목록Time-series Forecasting (9)
iMTE
1) Time seires 는 시간에 따른 data points의 collection으로서, time series에서 pattern을 찾아내거나 유의미한 정보를 얻어내는 과정을 time series analysis라고 정의한다. 이러헥 얻어낸 정보를 바탕으로 과거의 데이터를 모델링하고 앞으로의 미래를 예측한다. 2) Time series 는 level, trend, seasonality, cyclic variations, noise로 구성되며, 각각의 요소를 제거하고 분석하는 것이 매우 중요하다. Time series는 두가지의 형태로 additive model과 multiplicative 모델로 나타낼 수 있다. $$ Y[t] = T[t] + S[t] + c[t] + e[t]$$ $$ Y[t] = T[..
AR, MA, ARMA는 정상성을 만족하는 시계열에서 시계열 데이터를 표현하는데 사용되었던 모델이다. 하지만, 실제 시계열 데이터를 보자면, 많은 데이터들이 비정상적인 특징을 갖고 있음을 확인 할 수 있다. 추세가 있거나 계절성 등이 포함되어 있는데, 이런 정보들은 간단히 시계열 데이터를 plot 해보면 알 수 있다. 이런 시계열 데이터에서 표본 ACF를 구하면 시차에 대해서 매우 서서히 감소하는 형태를 확인 할 수 있는데, 이는 잘못된 모형 identification으로 이어질 수 있다. 1) 시계열 데이터에서 추세가 있는 경우 간단하게 differencing을 통해서 추세를 제거할 수 있다. 1차 차분은 다음과 같이 표현된다. $\Delta Z_t = Z_t-Z_{t-1}=(1-B)Z_t$ d차 차분..
특정 시계열 데이터가 주어졌고, 추세, 계절성을 제거하여 정상성을 만족하는 시계열로 변환을 하였을 때, 표본 ACF와 표본 PACF를 바탕으로 ARMA의 p,q 를 추정한다. 이렇게 추정된 ARMA 모형은 이전 값을 갖고 예측을 할 수 있다. 예측과 관련되서, 시계열 모델은 예측을 위한 모델이라기 보다는 주어진 시계열 데이터를 잘 설명할 수 있는 모델이라고 보는 시각이 옳은 것으로 생각된다. 이후의 예측은 주어진 과거 데이터를 잘 설명하는 모델로 부터 앞으로 가장 나타날 그럴 듯한 현상에 대해 정보를 제공해 주고, 사용자는 이 정보를 바탕으로 앞으로 어떤 선택을 할지 도움을 받을 수 있다. 먼저, 시점 n 까지의 시계열 관측치로부터 1 step 이후의 예측치를 $f_{n,1}$로 나타내자. 만약에 k s..
시계열 데이터를 분석해보면, 이전 포스팅처럼 복잡한 과정 없이 python 등의 툴을 사용하면 쉽게 계수를 추정해준다. 계수를 추정하기 전, 주어진 시계열 데이터가 정상성을 만족하는지, 또, 정상성을 만족한다면 어떤 모형을 선택해야 할지에 대한 의문이 있을 수 있다. 이전 포스팅에서 본 것처럼 AR과 MA 그리고 ARMA는 ACF, PACF의 형태를 바탕으로 시차 order를 확인할 수 있는데, 이를 identification이라고 한다. 시계열 모형의 식별은 다음의 순서를 통해 진행된다. 1) 시계열 데이터를 먼저 plot 해서, 정상성의 여부를 검토를 해야한다. 만약 추세 (trend)가 있거나, 계절성 (seasonality)가 있는 경우 이를 먼저 제거하는 것이 중요하다. 보통 추세를 제거할 때에..
이전 포스팅에서 정상성 시계열은 AR과 MA로 나타낼 수 있음을 설명하였다. 이번 포스팅에는 AR, MA 모형을 각각 설명하고 이 두개가 합친 ARMA 모형에 대해서 소개하고자한다. 먼저, AR의 기본적인 형태는 다음과 같다. $Z_t=\phi_1 Z_{t-1}+a_t$ 위 식에서 $\phi$는 정상성 조건을 만족시키며, $a_t$는 평균이 0, 분산이 $\sigma^2$을 갖는 white noise 이다. 위 식은 시차 1의 과거 값에 영향을 받음으로, AR(1) 모형이라고 부른다. 만약 시차 p인 AR(p) 모형은 다음과 같이 표현된다. $Z_{t}=\phi_1 Z_{t-1}+\phi_2 Z_{t-2}+...+\phi_p Z_{t-p}+a_t$ 위 식에서 $\phi$는 정상성 조건을 만족시킨다. 간단..
보통 시계열분석에서 stationary 시계열을 다루며, non-stationary 시계열은 여러 변환 (예, differentiation) 들을 통해서 정상적인 시계열으로 바꾼 이후에 분석을 한다. 1) 강정상성, strong stationary ($Z_1,...,Z_m$)과 ($Z_{1+k},...,Z_{m+k}$) ($k>1$)이 동일한 결합확률분포를 가질 때 strong stationry 시계열이라고 한다. 2) 위의 조건을 만족할 경우 다음 성질을 갖는다. (1) $E[Z_t]=\mu, t\geq 1$ (2) $Var[Z_t]=\sigma^2=\gamma (0), t\geq 1$ (3) $Cov[Z_t,Z_{t-k}]=Cov[Z_{t+k},Z_t]=\gamma (k), t\geq 1$ (자기공분..
모델을 만들어 낸 다음에, 모델의 예측 성능을 평가하기 위해서는 예측성능 척도가 필요하다. 먼저, error는 다음과 같이 정의가 된다. $$e_{t,1}=X_{t+1}-f_{t,1}$$ 위 식에서, $X_{t+1}$은 t+1 시점의 실제 값이고, $f_{t,1}$은 t 시점에서 모델에 의해 예측된 t+1 값을 의미한다. 만약 여러개의 관측치에 대한 예측 오차를 계산할 때, 4개의 예측 성능 척도가 사용된다. 1) Mean squared error (MSE) 2) Root mean squared error (RMSE) 3) Mean absolute deviation (MAD) 4) Mean absolute percent error (MAPE) 위 척도는 다음과 같은 수식으로 나타낼 수 있다. $MSE=\..
1. Smoothing method (exponential smoothing)1) 분석 먼저, 앞의 분석에서는 N개의 sample을 사용해서 평균 값을 구했다. 이외에 전체 데이터에 가중치를 곱해서 smoothing을 하는 방법이 있는데, 이 방법을 exponential smoothing이라고 한다. 시점 T에는 1의 가중치를, 이후 시점 T-1에는 lambda의 가중치, 시점 T-2에는 lambda^2의 가중치를 주어, 과거의 값을 더 반영하지 않고, 최근 값을 더 반영하여 smoothing하는 방법이다.Smoothing constant a는 0과 1 사이이며, 위 식은 moving average와 달리, 이전 값을 저장하지 않아도 되기 때문에 memory 효율 면에서 유횽하다. (Deep learni..
1. Smoothing method (moving average)1) 분석보통 시계열의 데이터는 noisy한 경우가 있다. Noisy한 데이터를 보면 어느 시간에서 드러나는 계절성과 패턴을 파악하는 것이 어렵다. 따라서, noisy한 데이터를 제거함으로써 시계열의 시간에 따른 패턴을 파악하는 것이 필요하다. 보통 moving average와 exponential smoothing 방법이 사용된다. 가장 먼저, moving average에 대한 개념부터 파악해보자. 먼저 시계열 X가 horizontal pattern을 갖는다고 가정하면, simple moving average는 다음과 같이 계산된다. a는 white noise로 평균이 0이고 표준편차가 sigma인 normal distribution을 따..