Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 영상제작기
- 브라이틱스
- 혼공학습단
- 모델링
- Brightics를 이용한 분석
- 팀 분석
- Brightics
- 삼성 SDS Brigthics
- 직원 이직률
- 직원 이직여부
- 혼공
- 삼성 SDS
- 포스코 청년
- 개인 의료비 예측
- 추천시스템
- Brigthics Studio
- 삼성SDS Brigthics
- Brightics Studio
- 포스코 아카데미
- 데이터분석
- 캐글
- 데이터 분석
- Brigthics
- 혼공머신러닝딥러닝
- 브라이틱스 서포터즈
- Brigthics를 이용한 분석
- 삼성SDS
- 혼공머신
- 삼성SDS Brightics
- 노코드AI
Archives
- Today
- Total
데이터사이언스 기록기📚
[시계열 분석] Ch.4 정리 본문
Ch.4 시계열 데이터의 시뮬레이션
- 시계열 데이터를 생성하는 방법
① 시계열 데이터 시뮬레이션 vs 다른 종류의 데이터 시뮬레이션 - 시간 흐름 처리 시 새로운 분야에서 고려
② 코드 기반 시뮬레이션 예시
③ 시계열 시뮬레이션 동향
- 관련있는 시뮬레이션
- 발견적 시뮬레이션(heuristic) : 세상이 움직여야하는 타당한 방식 -> 규칙을 코드로 옮김
- 이산사건 시뮬레이션(discrete event) : 세상의 규칙을 적용 받는 개별 액터 -> 세상이 변화하는 방식 관찰
- 물리기반 시뮬레이션(physics-based) : 물리법칙을 적용하여 시간에 따른 시스템 진화 방식 관찰
4.1 시계열 시뮬레이션의 특별한 점
- 시계열 데이터에서 데이터 시뮬레이션을 하는 이유
- (시계열) 동일한 시계열, 두 데이터가 서로 다른 시간에 일어나 정확히 비교하는게 어려움
-> 특정시간에 발생한 일을 예측하려면 필요
4.1.1 시뮬레이션과 예측
- 시뮬레이션과 예측 공통점
- 시스템의 유동성, 파라미터에 대한 가설 세룸 -> 가설 기반 생성될 데이터 추론
- 시뮬레이션과 예측 차이점
시뮬레이션 | 예측 | |
정성적 관측 | 통합하는게 더 쉬움 | 어려움 |
확장가능성 | 여러가지 시나리오 관찰 가능 | 신중하게 처리해야 함 |
위험 부담 | 가상이라 위험부담 적음 | 위험부담 많음 |
4.2 코드로 보는 시뮬레이션
더보기
[생각해볼것]
- 시계열 제작 시 데이터 배열 크기, 시간적 요소 인간중심적일 수 있는지
- 물리 시뮬레이션의 n번째 단계의 시간 요소가 비구체적, 분류되지 않는지 생각
- 이메일 열람 -> 기부 or 기부X 상관관계 가설 검정 합성데이터
- 택시 기사 교대 시간 + 하루 동안 탑승객 빈도 -> 택시 무리 집단 행동 살피기
- 점진적 개별 자기요소 위치 맞춰나가는 자성물질 물리적 과정
4.2.1 스스로 직접 만들어보기
- 회원 정보 테이블 제작
# yearJoined에 무작위 부여
import numpy as np
import pandas as pd
years = ['2014','2015','2016','2017','2018']
memeberStatus = ['bronze', 'silver', 'gold','inactive']
memberYears = np.random.choice(years, 1000,
p = [0.1, 0.1, 0.15, 0.30, 0.35])
memberStats = np.random.choice(memeberStatus, 1000,
p = [0.5,0.3,0.1,0.1])
yearJoined = pd.DataFrame({'yearJoined' : memberYears,
'memberStats' : memberStats})
-
# 주별로 회원의 이메일 열람 시점 나타내는 테이블
## 이메일 3통 보내는 기관 행동 정의 - > 행동패턴 (이메일 열람한 적 없음, 일정한 수준 이매일 열람 및 참여율, 참여 수준의 증가 또는 감소)
NUM_EMAILS_SENT_WEEKLY = 3
# 이메일 열람한 적 없음
def never_opens(period_rng):
return []
# 일정한 수준 이매일 열람 및 참여율
def constant_open_rate(period_rng):
n,p = NUM_EMAILS_SENT_WEEKLY, np.random.uniform(0,1)
num_opened = np.random.binomial(n, p, len(period_rng))
return num_opened
##### p.166부터 작성해야 함
728x90
'Data > 시계열 분석' 카테고리의 다른 글
[시계열 분석] CH.3 정리 (0) | 2024.02.23 |
---|---|
[시계열 분석] 1장-2장 정리 (0) | 2024.02.15 |
Comments