본문 바로가기
미국 대학원 진학기/Miami University 통계학 석사

[미국 통계학 대학원] 통계학과 석사 커리큘럼 (통계학과 과목/교과서)

by Data_to_Impact 2020. 7. 30.
반응형

[미국 통계학 대학원] 통계학과 석사 커리큘럼 (통계학과 과목/교과서)

 

 

들어가며

 

나는 학부에서 수학과 경제학을 전공하였는데, 확률과 통계학이나 수리통계학과 같은대학원 진학에 관련되는 과목을 수강하기는 했지만, 내가 나온 학교에는 통계학과가 존재하지 않았기 때문에 통계학과에서 어떤 과목을 중심으로 공부를 해야하는지 잘 알지 못했고, 그 때문에 통계학이라는 과목의 큰 맥락과 철학을 제대로 이해하는데 시간을 많이 썻던 것으로 기억을 한다.

 

지금에서야 각 수업들이 어떤 것들을 배우고 어떤 책으로 어떻게 공부 방향을 잡아야 할지 미리 알았더라면 적응이 더 수월하지 않았을까 하는 아쉬움이 드는데, 혹시나 나처럼 학부때 통계학을 전공하지 않은 비전공자이면서 통계학 석사 과정을 진학을 하려는 분들이 시행착오를 조금이나마 줄였으면 하는 바람으로 통계학과 석사과정의 커리큘럼에 대한 글을 쓰게 되었다.

 

우선 학기 별로 순차적으로 나열을 하였고, 필수과목이 아닌 선택 과목들은 내가 수강을 했던 과목들을 위주로 설명을 하려고 한다. 그리고 구직을 하면서 취업에 실질적으로 도움이 되었던 과목들을 언급하는 것으로 글을 마무리 하려고 한다. 

 

통계학 석사 커리큘럼

 

이 글은 마이애미대학교 (Miami University)의 통계학과 석사과정의 커리큘럼을 기준으로 글이 쓰였지만, 보통 대학원 과정 프로그램이 몇몇 선택과목을 제외하면 과목들이 대동소이 하기 때문에 아래의 내용으로 석사과정의 큰 맥락을 파악하는데 별 무리가 없을 것이라고 생각한다. 다만, 본인이 진학하고자 하는 학교마다 조금씩 차이가 있을 수 도 있는데, 정확한 내용은 각 학교의 학과 홈페이지를 살펴보는 것이 좋을듯 하다. 

 

학부 과정이 한 학기에 5~6 과목을 듣는 것에 반해, 대학원 과정은 주로 3학점 짜리 과목 3개 정도를 듣게 된다. 과목 수가 적다고 만만하게 보아서는 안되는 것이, 그 만큼 공부해야 될 양이 많기도 하고 혹시나 조교일을 한다면 거기에도 시간을 할애해야하기 때문에 결코 설렁설렁 공부해서는 만족할 만한 성과를 얻지 못할 가능성이 크다.

 

학부 과정에서는 3.0 (B) 이하의 성적도 용납이 되는 반면에, 대학원에서는 1년 이 지난 이후 평균 학점이 3.0이 되지 않는다면 졸업 요건을 맞추지 못해 프로그램에서 쫒겨나게 된다. 또, 공부를 열심히 하지 않는다면 1 년이 지난 이후 평가하게되는 Qualifying Exam을 통과할 가능성도 낮아지기 때문에 첫 1년은 취업을 목표로 하던 박사진학을 목표로 하건 무조건 열심히 공부하고 좋은 성적을 받는 것이 좋다. 

 

영문 과목명 - 한글 과목명 (교과서 링크)  

 

* 첫 번째 학기

 

Theory of Statistics I - 통계이론 1 (교과서 링크)

Regression Analysis  - 회귀분석 (교과서 링크)

Statistcial Programming - 통계 프로그래밍 (교과서 링크)

 

 

Statistical Programming 수업에서... Dr W. 가 SAS 데이터 스텝에 대해서 설명을 하고 있다.

 

첫 학기에는 기본적으로 통계이론의 기초가 되는 회귀분석, Cassella & Berger의 Statistical Inference 교과서의 앞부분인 확률 이론, 그리고 통계툴인 SAS에 대해서 배운다. 요즘엔 Statistical Programming 과목에서 SAS 대신 R을 배우는 학교도 많다고 한다. 하지만 여전히 Pharmaceutical Industry에서는 SAS를 대부분 사용하기 때문에 배워 둬서 전혀 나쁠 것이 없는 과목이다.

 

타 전공에서 건너온 학생들도 보통 기초 통계학을 듣고 오기 때문에 무리없이 Regression Analysis나 Statistical Programming을 따라 오지만 본인이 수리통계학과목을 과목을 수강하지 않았고, 수학 과목의 증명에 익숙하지 않다면 많이 해맬 수 있는 과목이 Theory of Statistics I 이다. 예습까지는 아니더라도 수리통계학과 학부과정 해석학을 미리 듣고 온다면 첫 학기에 적응하는 것에 큰 도움을 받을 수 있다. 위상수학이나 실해석학 과목을 들었다면 Probability 앞 부분인 Sigma Field를 이해하는데 많은 도움이 될 것이다. 

 

 

* 두 번째 학기

 

Design of Experiments - 실험계획법 (교과서 링크)

Theory of Statistics II - 통계이론 2 (교과서 링크)

Generalized Linear Model - 일반화선형모형 (교과서 링크)

 

(Design of Experiments) 실험게획법 수업은 도움이 되는 수업이기는 했지만, 나랑 잘 맞지 않는 교수여서 그런지 그렇게 열심히 공부하지는 않았던 것 같다.

 

두 번째 학기에서는 Linear Model에서 가정을 일반화해서 Link function을 이용하는 Generalized Linear Model에 대해서 공부를 하게 된다. 이 과목에서는 지난 학기에서보다 Matrix Theroy를 많이 사용하는데, Linear Algebra (선형대수학) 공부를 미리 해온다면 큰 도움이 된다.

 

통계이론 1에서 Probability 부분을 중점적으로 다루었다면, 통계이론 2에서는 교과서의 뒷부분인 Statistical Inference를 위주로 진도를 나가게 된다. 앞서 말했듯이 수학적으로 증명을 하는 사고에 익숙하지 않으면 시험에서 좋은 성적을 받기 힘들 수 도 있기 때문에 해석학과 같은 증명위주의 수업을 듣는 것이 도움이 된다. 

 

Design of Experiments는 한국어의 과목명으로는 실험계획법이라고 하는데, 빅데이터/머신러닝 시대에 구식으로 취급받기도 하지만 여전히 많은 산업에서 유용하고도 중요한 과목이라고 여겨지는 과목이다. 이 과목에서는 어떤 실험을 할때 통계적으로 타당성을 검증하기 위해서는 어떤 실험의 조건이 충족되어야 하고 (e.g., Block, Factor etc..,) 비교하고자 하는 그룹별로 차이가 존재한다는 것을 증명하려면 몇개의 샘플이 수집되어야 하는지 등등을 배우는데, 잘 공부해 놓으면 컨설팅 업무를 하는데 큰 도움이 될 만한 과목이다. 실제로 내가 임상시험 업무를 하면서 몇 명의 환자들을 그룹별로 모집을 해야하는지 계산을 해야 될 때도 많은데, 이때 Design of Experiments의 내용이 쓰이곤 한다. 

 

 

* 여름방학

 

여름 방학을 어떻게 보낼지는 본인의 Goal이 박사진학인지 혹은 석사 이후 취업인지에 따라서 방향성이 많이 달라진다. 만약 박사진학을 목표로 한다면 주로 할 수 있는 방법은 

 

1. 그 동안 듣지 못했던 진학에 도움되는 수학과 과목을 듣는다던지

2. GRE Math Subject에서 좋은 성적을 받는다던가 

3. 연구를 빨리 시작해서 추천서를 좋게 받는 준비를 한다던지 

 

하는 방법이 있을 것이고, 취업을 염두한다면 무조건 인턴쉽을 하는 것을 추천한다. 

 

 

* 세 번째 학기

 

Machine Learning (혹은 Statistcial Learning)- 머신러닝

Statistical Consulting - 통계 컨설팅

Biostatistics - 생물통계학

 

 

세 번째 학기 이후로는 본인이 선택해서 수강을 할 수 있는 자유가 조금 생기는데, 내 경우에는 Computer Science 학과에서 Machine Learning을 수강을 하였고, 다른 선택과목으로는 Biostatistics과목을 들었다. 나는 CS학과의 Machine Learning을 들었지만, 통계학과에서는 Statistical Learning 이라는 과목으로 비슷한 내용을 가르쳤다. 다만, CS학과에서는 프로젝트에서 구현에 대해서 더 초점을 두었지만 통계학과에서는 이론에 더 중점을 두어서 가르쳤다고 한다.

 

Biostatistics이라는 과목은 과목 자체가 너무 방대해서 한 학기에 끝내기는 조금 무리인 감이 있었지만 Biostatistics에서 흔히 쓰이는 Survival Analysis와 같은 방법론을 전반적으로 이해하는데에는 이 과목이 도움이 되었던 것 같다. 수업을 들을때만 하더라도 내가 Biostatistics관련일을 할지 몰라 얼마나 이 과목이 나중에 도움이 될지 당시에는 회의적였지만, 지금 일을 할때 의외로 많은 도움이 되고 있다. 통계학 졸업자들의 Biostatistics 관련 일자리가 미국에는 많기 때문에 선택과목으로 들을 기회가 있다면 듣는 것을 추천한다. 

 

Statistical Consulting에서는 이제까지 배운 통계 이론들을 기초로 실제 정부 기관이나 기업을 클라이언트로 통계 컨설팅 서비스 실습을 하는데, Miami University의 학과장인 John Bailer가 발이 넓기 때문에 근처의 EPA, NIOSH같은 정부기관이나 Cincinnati의 기업들에서 일하는 졸업생을 초청해서 데이터를 가지고 와서 분석 실습을 하기도 한다. 

 

 

* 네 번째 학기 (마지막 학기)

 

Data Visualization - 데이터 시각화

Indepedent Research - 독립 연구

 

 

Data Visualization (데이터 시각화) 과목은 재미있기도 하였지만, 실제로 취업을 할때도 큰 도움이 되었던 과목이다.

마지막 학기에는 본인이 과목을 조금 적게 듣고 연구에 더 집중을 하던지 아니면 듣고 싶은 코스웍을 더 들을지 결정을 할 수 있는데, 내 경우에는 마지막 학기를 Cincinnati Children's Hospital에서 CPT를 쓰고 풀타임으로 일을 하고 있었기 때문에, 코스웍을 더 하나 이상 듣기에는 역부족 이였다. Data Visualization 수업은 데이터를 가지고 시각화를 하는 것을 배우는 수업이였는데, 수업이 굉장히 실용적이였고 취업 인터뷰를 다니는데 도움이 되었던 과목이다. 툴로는 ggplot2를 사용했는데, 시각화 뿐만이 아니라 dplyr이라는 페키지로 정형 데이터를 다루는 것에 정말 큰 도움이 되었던 수업이다.

 

독립연구에서는 졸업을 할때 발표를 해야하는 본인의 Master Project/Thesis관련 일을 할 수 있는데, 본인의 Advisor가 될 교수와 미팅시간을 주기적으로 시간을 잡고 연구를 진척 시킬 수 있다. 

 

취업에 도움이 되었던 과목들

 

인터뷰를 받고 취업에 도움이 되었던 과목들을 생각해보면 Statistical Programming, Machine Learning, Data Visualization, Biostatistics가 도움이 되었는데, Biostatistics 관련 잡에서는 SAS를 쓰는 Statistical Programming 그리고 Biostatistics 수업이 도움이 되었고, 기타 Data Science 잡에서는 머신러닝과목과 시각화 과목이 큰 도움이 되었다. 한 유통업체의 인터뷰에서는 큰 데이터 셋을 하고 전처리를 하고 시각화를 하는 과정을 1 시간 정도 시간을 주고 시켰었는데, 그 학기에 시각화 수업을 듣고 있어서 정말 수월하게 인터뷰를 통과했던 기억이 난다. 

 

마무리

 

이상으로 본인의 경험을 위주로 통계학과 석사과정 2년을 훑어보았는데, 비 전공자이면서 앞으로 통계학 대학원 과정에 진학을 할 분들이 조금이나마 시행착오를 줄였으면 하는 바람으로 글을 작성하였다. 돌이켜 생각해보면 정말 정신없고 쉽지 않은 과정이였지만, 대학원 과정은 그만큼 배운것도 많았고, 내게 다양한 기회를 열어주었다고 생각을 한다. 앞으로 공부를 하고 있거나 이미 공부를 하게 되시는 분들이 이 글을 보고 조금이나마 도움이 되었으면 마음으로 글을 마치려고 한다. 

 

 

 

 

기타 궁금하거나 질문이 있으신 분들은 아래의 공개 댓글로 질문을 하시면 아는 선에서 답변을 해 드리겠습니다. 

 

반응형

댓글