데이터사이언스 기록기📚

[시계열 분석] Ch.4 정리 본문

Data/시계열 분석

[시계열 분석] Ch.4 정리

syunze 2024. 3. 28. 16:15

Ch.4 시계열 데이터의 시뮬레이션

- 시계열 데이터를 생성하는 방법

 ① 시계열 데이터 시뮬레이션 vs 다른 종류의 데이터 시뮬레이션 - 시간 흐름 처리 시 새로운 분야에서 고려

 ② 코드 기반 시뮬레이션 예시

 ③ 시계열 시뮬레이션 동향

 

- 관련있는 시뮬레이션

  • 발견적 시뮬레이션(heuristic) : 세상이 움직여야하는 타당한 방식 -> 규칙을 코드로 옮김
  • 이산사건 시뮬레이션(discrete event) : 세상의 규칙을 적용 받는 개별 액터 -> 세상이 변화하는 방식 관찰
  • 물리기반 시뮬레이션(physics-based) : 물리법칙을 적용하여 시간에 따른 시스템 진화 방식 관찰

4.1 시계열 시뮬레이션의 특별한 점 

- 시계열 데이터에서 데이터 시뮬레이션을 하는 이유

  • (시계열) 동일한 시계열, 두 데이터가 서로 다른 시간에 일어나 정확히 비교하는게 어려움
    -> 특정시간에 발생한 일을 예측하려면 필요

4.1.1 시뮬레이션과 예측 

- 시뮬레이션과 예측 공통점

  • 시스템의 유동성, 파라미터에 대한 가설 세룸 -> 가설 기반 생성될 데이터 추론

- 시뮬레이션과 예측 차이점

  시뮬레이션 예측
정성적 관측 통합하는게 더 쉬움 어려움
확장가능성 여러가지 시나리오 관찰 가능 신중하게 처리해야 함
위험 부담 가상이라 위험부담 적음 위험부담 많음

 


4.2 코드로 보는 시뮬레이션

더보기

[생각해볼것]

- 시계열 제작 시 데이터 배열 크기, 시간적 요소 인간중심적일 수 있는지

- 물리 시뮬레이션의 n번째 단계의 시간 요소가 비구체적, 분류되지 않는지 생각

- 이메일 열람 -> 기부 or 기부X 상관관계 가설 검정 합성데이터 

- 택시 기사 교대 시간 + 하루 동안 탑승객 빈도 -> 택시 무리 집단 행동 살피기 

- 점진적 개별 자기요소 위치 맞춰나가는 자성물질 물리적 과정 

4.2.1 스스로 직접 만들어보기

- 회원 정보 테이블 제작

# yearJoined에 무작위 부여
import numpy as np
import pandas as pd

years = ['2014','2015','2016','2017','2018']
memeberStatus = ['bronze', 'silver', 'gold','inactive']

memberYears = np.random.choice(years, 1000,
                               p = [0.1, 0.1, 0.15, 0.30, 0.35])
memberStats = np.random.choice(memeberStatus, 1000,
                                p = [0.5,0.3,0.1,0.1])
yearJoined = pd.DataFrame({'yearJoined' : memberYears,
                           'memberStats' : memberStats})

 

 

# 주별로 회원의 이메일 열람 시점 나타내는 테이블
## 이메일 3통 보내는 기관 행동 정의 - > 행동패턴 (이메일 열람한 적 없음, 일정한 수준 이매일 열람 및 참여율, 참여 수준의 증가 또는 감소)
NUM_EMAILS_SENT_WEEKLY = 3

# 이메일 열람한 적 없음
def never_opens(period_rng):
    return []

# 일정한 수준 이매일 열람 및 참여율
def constant_open_rate(period_rng):
    n,p = NUM_EMAILS_SENT_WEEKLY, np.random.uniform(0,1)
    num_opened = np.random.binomial(n, p, len(period_rng))
    return num_opened
##### p.166부터 작성해야 함
728x90

'Data > 시계열 분석' 카테고리의 다른 글

[시계열 분석] CH.3 정리  (0) 2024.02.23
[시계열 분석] 1장-2장 정리  (0) 2024.02.15
Comments