인공지능 개발자 수다(유튜브 바로가기) 자세히보기

통계

[시계열] AR 모델(Autoregressive, 자기회귀)

Suya_03 2023. 6. 13. 15:53

목차

    반응형

    1. 소개 (Autoregressive) 

    - 설명: 시계열 데이터를 모델링하는 데 사용되는 통계적인 방법

    - 가정: AR 모델은 현재 시점의 데이터가 이전 시점의 데이터에 의존한다는 가정에 기반하여 작동

    - AR(p)에서 p는 차수를 나타냄

    - 사용 분야: 시계열 데이터의 예측, 변동성 분석, 추세 분석 등에 활용

     

    2. 수식

    • c는 상수 항
    • φ_1, φ_2, ..., φ_p는 각각 1부터 p까지의 시차(lag)에 대한 계수(coefficient)
    • ε_t는 백색 잡음(white noise)
    • X_{t-1}, X_{t-2}, ..., X_{t-p}는 각각 t-1, t-2, ..., t-p 시점의 데이터

    $$ X_t = c + \phi_1 * X_{t-1} + \phi_2 * X_{t-2} + ... + \phi_p * X_{t-p} + \varepsilon_t $$

    • 수식의 의미
      • 이전시점 데이터 x 가중치 + 잡음

     

    3. 한계점

    • 차수가 낮을 수록 과거에 일어난 일을 기억하지 못함. 긴 기간동안의 패턴을 모델링하기 어려울 수 있음
    • 차수가 너무 높으면 과적합 발생
    • 외부 요인이 무시됨
    • AR모델은 정상성을 가정함, 비정상성 데이터는 재대로 예측하지 못함

    4. 개선방안

    • 다른 모델과 결합해서 사용
    • ARIMA의 경우 차분과 이동평균을 결합하여 비정상성 데이터와 외부 요인을 고려하도록 함

     

     

    반응형