Data Analytics

시계열 데이터 분석이란? Time Series Analysis

cheersHena 2023. 2. 21. 19:19
반응형

시계열 데이터

일정기간 동안 수집된 순차적 데이터 셋의 집합. 

시간의 흐름에 따라 순서대로 관측되어 시간의 영향을 받게 되는 데이터 ex) 일별, 월별, 분기별, 년도별 .. 

이렇게 순차적으로 발생한 연속적인 관측치는 서로 상관관계를 맺고 있음

 

시계열 데이터 분석의 목적

미래의 값을 예측하기 위함. 

시계열이 갖고 있는 법칙성을 발견해 이를 모형화하고 추정된 모형을 통해 미래의 값을 예측하기 위해 분석.  

 

 

시계열 데이터 예시 

  • 쇼핑몰 구매 데이터 
  • 소비자 물가 지수
  • 일일 주식 트렌드 
  • 월별/ 분기별/ 연도별 특정 사건의 수치

 

시계열의 종류 

변동요인은 이론상 크게 4가지로 나뉜다. 

1. 추세변동 (Trend)

  • 시계열의 장기간에 걸쳐 점진적으로 지속적인 변화상태를 나타낸 것
  • 시간의 흐름에 따라 관측값이 지속적으로 상승 혹은 하강하는 추세를 갖는 변동.
  • 경제 데이터에서 주로 발생한다. 

2. 계절변동(Seasonal variations)

  • 관측된 시계열 데이터를 특정 기간의 주기로 기록했을 때, 기후 등과 같은 자연의 조건, 사회적 관습, 혹은 제도 등의 영향을 받아 계절적인 차이를 나타내는 것.
  • 시계열 자료에서 주기적인 패턴을 가지고 반복적으로 나타나는 주기 변동
  • 보통 분기별/ 월별 자료에서 나타난다.

 

3. 순환변동 (Cycle)

주기적인 변화를 가지나, 수년간의 간격을 두고 상승과 하락이 주기적으로 나타는 변동

순환변동과 계절변동을 혼동할 수 있지만, 계절변동으로 설명되지 않는 장기적인 주기 변동을 의미. 

 

4. 불규칙 변동 (Random)

시간에 따른 규칙적인 변동과 무관하게 랜덤하게 나타나는 변동. 

사전적으로 예상할 수 없는 특수한 사건에 의해 야기되는 변동(지진, 전쟁, 홍수, 파업 .. ) 

명확히 설명될 수 없는 요인에 의해 발생되는 우연변동 

 

 

 

반응형