일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Class activation map
- SmoothGrad
- coding test
- 딥러닝
- GAN
- 설명가능한 인공지능
- python
- cs231n
- 설명가능한
- AI
- xai
- Cam
- 코딩테스트
- keras
- 시계열 분석
- Machine Learning
- Interpretability
- Score-CAM
- 백준
- 기계학습
- 메타러닝
- meta-learning
- 인공지능
- Unsupervised learning
- Deep learning
- Explainable AI
- grad-cam
- Artificial Intelligence
- 코딩 테스트
- 머신러닝
- Today
- Total
목록시계열 분석 (5)
iMTE
1) Time seires 는 시간에 따른 data points의 collection으로서, time series에서 pattern을 찾아내거나 유의미한 정보를 얻어내는 과정을 time series analysis라고 정의한다. 이러헥 얻어낸 정보를 바탕으로 과거의 데이터를 모델링하고 앞으로의 미래를 예측한다. 2) Time series 는 level, trend, seasonality, cyclic variations, noise로 구성되며, 각각의 요소를 제거하고 분석하는 것이 매우 중요하다. Time series는 두가지의 형태로 additive model과 multiplicative 모델로 나타낼 수 있다. $$ Y[t] = T[t] + S[t] + c[t] + e[t]$$ $$ Y[t] = T[..
AR, MA, ARMA는 정상성을 만족하는 시계열에서 시계열 데이터를 표현하는데 사용되었던 모델이다. 하지만, 실제 시계열 데이터를 보자면, 많은 데이터들이 비정상적인 특징을 갖고 있음을 확인 할 수 있다. 추세가 있거나 계절성 등이 포함되어 있는데, 이런 정보들은 간단히 시계열 데이터를 plot 해보면 알 수 있다. 이런 시계열 데이터에서 표본 ACF를 구하면 시차에 대해서 매우 서서히 감소하는 형태를 확인 할 수 있는데, 이는 잘못된 모형 identification으로 이어질 수 있다. 1) 시계열 데이터에서 추세가 있는 경우 간단하게 differencing을 통해서 추세를 제거할 수 있다. 1차 차분은 다음과 같이 표현된다. $\Delta Z_t = Z_t-Z_{t-1}=(1-B)Z_t$ d차 차분..
시계열 데이터를 분석해보면, 이전 포스팅처럼 복잡한 과정 없이 python 등의 툴을 사용하면 쉽게 계수를 추정해준다. 계수를 추정하기 전, 주어진 시계열 데이터가 정상성을 만족하는지, 또, 정상성을 만족한다면 어떤 모형을 선택해야 할지에 대한 의문이 있을 수 있다. 이전 포스팅에서 본 것처럼 AR과 MA 그리고 ARMA는 ACF, PACF의 형태를 바탕으로 시차 order를 확인할 수 있는데, 이를 identification이라고 한다. 시계열 모형의 식별은 다음의 순서를 통해 진행된다. 1) 시계열 데이터를 먼저 plot 해서, 정상성의 여부를 검토를 해야한다. 만약 추세 (trend)가 있거나, 계절성 (seasonality)가 있는 경우 이를 먼저 제거하는 것이 중요하다. 보통 추세를 제거할 때에..
1. Smoothing method (exponential smoothing)1) 분석 먼저, 앞의 분석에서는 N개의 sample을 사용해서 평균 값을 구했다. 이외에 전체 데이터에 가중치를 곱해서 smoothing을 하는 방법이 있는데, 이 방법을 exponential smoothing이라고 한다. 시점 T에는 1의 가중치를, 이후 시점 T-1에는 lambda의 가중치, 시점 T-2에는 lambda^2의 가중치를 주어, 과거의 값을 더 반영하지 않고, 최근 값을 더 반영하여 smoothing하는 방법이다.Smoothing constant a는 0과 1 사이이며, 위 식은 moving average와 달리, 이전 값을 저장하지 않아도 되기 때문에 memory 효율 면에서 유횽하다. (Deep learni..
1. Smoothing method (moving average)1) 분석보통 시계열의 데이터는 noisy한 경우가 있다. Noisy한 데이터를 보면 어느 시간에서 드러나는 계절성과 패턴을 파악하는 것이 어렵다. 따라서, noisy한 데이터를 제거함으로써 시계열의 시간에 따른 패턴을 파악하는 것이 필요하다. 보통 moving average와 exponential smoothing 방법이 사용된다. 가장 먼저, moving average에 대한 개념부터 파악해보자. 먼저 시계열 X가 horizontal pattern을 갖는다고 가정하면, simple moving average는 다음과 같이 계산된다. a는 white noise로 평균이 0이고 표준편차가 sigma인 normal distribution을 따..