본문 바로가기
데이터 사이언스 이야기/통계학

통계적 모델링(Statistical Modeling)의 목적과 과정

by Data_to_Impact 2020. 12. 12.
반응형

통계를 배우는 이유?- 통계적 모델링의 목적과 과정

 

요즘에는 Coursera에서 베이지안 강의를 듣고있는데, 강의의 도입부에서 통계적 모델링의 목적과 과정에 관해서 잘 설명을 한 것 같아서 글로서 한번 정리를 해보려고 한다. 통계를 처음 배우는 사람이거나 통계학을 배웠지만 아직 체계가 잡히지 않은 사람이 이 글을 읽는다면 유용할 것 같다는 생각이 든다. 

 

통계적 모델링의 정의

 

통계적 모델링이란 확률/수학적인 모형을 가지고 현실세계의 데이터 형성 과정을 모방을 한 것이라고 정의를 한다. 이러한 모형은 현실을 그대로 반영하지는 못한다는 한계가 있지만, 그럼에도 불구하고 적절한 가정들(Assumptions) 하에 유용하게 쓰일 수 가 있다. 다음의 네 가지 경우는 이런 통계적 모델링의 활용을 유형화 한 것이다. 구체적인 유형들의 특징을 선거의 사례와 더불어서 설명을 하려고 한다. (차후에 사례가 추가 될 것임)

 

 

통계적 모델링의 목적

 

1. 불확실성의 측정 

2. 통계적 추론

3. 가설 검정을 위한 도구 제공

4. 예측 (Prediction) e.g., 머신러닝

 

통계적 모델링의 과정(Statistical Modeling Process)

 

1. 문제에 대한 이해 (Understand the problem)

2. 계획수립 및 데이터 수집(Plan and collect data)

3. 자료 탐색(Explore data)

4. 모델 상정(Postulate model)

5. 모델 적용(Fit model)

6. 모델 확인(Check model)

7. 더 나은 모델을 찾기 위한 4~6과정 반복 (Iterate 4~6 to find a better model)

8. 모델 사용

 

 

반응형

댓글