[시계열 분석] Ch.4 정리

Notice

Recent Posts

Recent Comments

Link

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

데이터사이언스 기록기📚

[시계열 분석] Ch.4 정리 본문

Data/시계열 분석

[시계열 분석] Ch.4 정리

syunze 2024. 3. 28. 16:15

Ch.4 시계열 데이터의 시뮬레이션

- 시계열 데이터를 생성하는 방법

① 시계열 데이터 시뮬레이션 vs 다른 종류의 데이터 시뮬레이션 - 시간 흐름 처리 시 새로운 분야에서 고려

② 코드 기반 시뮬레이션 예시

③ 시계열 시뮬레이션 동향

- 관련있는 시뮬레이션

발견적 시뮬레이션(heuristic) : 세상이 움직여야하는 타당한 방식 -> 규칙을 코드로 옮김
이산사건 시뮬레이션(discrete event) : 세상의 규칙을 적용 받는 개별 액터 -> 세상이 변화하는 방식 관찰
물리기반 시뮬레이션(physics-based) : 물리법칙을 적용하여 시간에 따른 시스템 진화 방식 관찰

4.1 시계열 시뮬레이션의 특별한 점

- 시계열 데이터에서 데이터 시뮬레이션을 하는 이유

(시계열) 동일한 시계열, 두 데이터가 서로 다른 시간에 일어나 정확히 비교하는게 어려움
-> 특정시간에 발생한 일을 예측하려면 필요

4.1.1 시뮬레이션과 예측

- 시뮬레이션과 예측 공통점

시스템의 유동성, 파라미터에 대한 가설 세룸 -> 가설 기반 생성될 데이터 추론

- 시뮬레이션과 예측 차이점

	시뮬레이션	예측
정성적 관측	통합하는게 더 쉬움	어려움
확장가능성	여러가지 시나리오 관찰 가능	신중하게 처리해야 함
위험 부담	가상이라 위험부담 적음	위험부담 많음

4.2 코드로 보는 시뮬레이션

[생각해볼것]

- 시계열 제작 시 데이터 배열 크기, 시간적 요소 인간중심적일 수 있는지

- 물리 시뮬레이션의 n번째 단계의 시간 요소가 비구체적, 분류되지 않는지 생각

- 이메일 열람 -> 기부 or 기부X 상관관계 가설 검정 합성데이터

- 택시 기사 교대 시간 + 하루 동안 탑승객 빈도 -> 택시 무리 집단 행동 살피기

- 점진적 개별 자기요소 위치 맞춰나가는 자성물질 물리적 과정

4.2.1 스스로 직접 만들어보기

- 회원 정보 테이블 제작

# yearJoined에 무작위 부여
import numpy as np
import pandas as pd

years = ['2014','2015','2016','2017','2018']
memeberStatus = ['bronze', 'silver', 'gold','inactive']

memberYears = np.random.choice(years, 1000,
                               p = [0.1, 0.1, 0.15, 0.30, 0.35])
memberStats = np.random.choice(memeberStatus, 1000,
                                p = [0.5,0.3,0.1,0.1])
yearJoined = pd.DataFrame({'yearJoined' : memberYears,
                           'memberStats' : memberStats})

# 주별로 회원의 이메일 열람 시점 나타내는 테이블
## 이메일 3통 보내는 기관 행동 정의 - > 행동패턴 (이메일 열람한 적 없음, 일정한 수준 이매일 열람 및 참여율, 참여 수준의 증가 또는 감소)
NUM_EMAILS_SENT_WEEKLY = 3

# 이메일 열람한 적 없음
def never_opens(period_rng):
    return []

# 일정한 수준 이매일 열람 및 참여율
def constant_open_rate(period_rng):
    n,p = NUM_EMAILS_SENT_WEEKLY, np.random.uniform(0,1)
    num_opened = np.random.binomial(n, p, len(period_rng))
    return num_opened
##### p.166부터 작성해야 함

728x90

'Data > 시계열 분석' 카테고리의 다른 글

[시계열 분석] CH.3 정리 (0)	2024.02.23
[시계열 분석] 1장-2장 정리 (0)	2024.02.15

'Data/시계열 분석' Related Articles

Comments

데이터사이언스 기록기📚

[시계열 분석] Ch.4 정리 본문

[시계열 분석] Ch.4 정리

Ch.4 시계열 데이터의 시뮬레이션

4.1 시계열 시뮬레이션의 특별한 점

4.1.1 시뮬레이션과 예측

4.2 코드로 보는 시뮬레이션

4.2.1 스스로 직접 만들어보기

'Data > 시계열 분석' 카테고리의 다른 글

티스토리툴바