내 지도교수였던 Dr. John Bailer는 Toxicology의 분야의 전문가이면서 국제통계기구(International Statistical Association)의 President를 맡고 있는 통계학계에서 힘이 있는 사람이다. 그는 여러 권의 책을 저술했는데, SAS Programming in SAS도 그 중에 하나이다.
대학원생 시절에 그의 Statistical Consulting 수업을 들었는데, 수업 도중에 그가 1학점짜리 Independent 스터디로 SAS 웹스크랩핑 코드를 좀 짜줄 학생을 구한다고 공지를 했었다. 당시에는 내가 박사지원을 제 1목표로 두고 있었고 좋은 박사과정에 진학하기 위해선 추천서가 엄청난 도움이 될 것이라는 것을 알기에 눈도장을 찍을 수 있는 좋은 기회이다 싶어 자원을 했다.
이후 미팅에서 설명을 들어보니 그는 이전에 Statistical Programming이라는 책을 출판했는데, 지난 번 버전에서 보완을 해서 2판을 내면서 Text minig(텍스트 마이닝) 부분을 추가하려고 한다 말했다. 그래서 나에게 SAS프로그램을 통해서 웹상의 HTML코드 크롤링하고, 유의미한 정보들만 SAS 내의 정형데이터로 저장을 하는 프로그램을 짜줄수 있는지 부탁을 했었다.대학원 생활을 할때는 학업 업무와 조교일만 해도 정신이 없기 때문에 시간을 내기가 좀 어려웠지만, 며칠동안 여기 저기 코드를 참고하고 그의 피드백을 참고해서 코드를 완성시켰다.
https://github.com/Sooyeong/Bailer_SAS_PROGRAMMING
그러고 1년이 넘게 흘렀다. 나는 내가 여기에 참가했던 사실 조차 까맣게 있고 있었다. 졸업을 하고도 Dr. Bailer와 나는 아직 연구 몇개를 같이 진행하고 있어서 연락을 주고 받는데, 얼마전 화상 미팅으로 그가 자신의 Statistical Programming 2nd Edition이 나왔다고 확인해보라고 귀뜸해줬다. 아마존에 들어가서 확인 해보니 내 이름도 코드에 Contributor에 들어가 있었다. 많은 사람들이 보는 책이 아니라 별로 대단한 소식은 아니지만, 내가 기여한 부분들이 인정을 받는 것 같아서 뿌듯한 느낌이 들었다.
지금도 회사에서 SAS를 매일 쓰지만, 아이러니하게도 나는 SAS라는 Language를 별로 좋아하지 않는다. 인터페이스도 너무 구식이고 무엇보다 코드의 Version Control이 힘들다. Pharmaceutical, Clinical Trial 산업에 일하는 사람들의 경우에는 어쩔 수 없이 이 SAS라는 언어를 써야 하는데, SAS를 가르치는 대학교가 점점 줄고 있어서 차후에는 다른분야와 마찬가지로 R로 대체가 되지 않을까 하는 생각이 든다.
공감과 댓글은 제가 글을 쓰는 큰 원동력이 됩니다-!
'일상다반사& 여행 > 일상다반사' 카테고리의 다른 글
Active X와 공인인증서 폐지 (0) | 2020.07.12 |
---|---|
코로나(COVID-19) 치료제 임상시험 프로젝트를 시작하다 (0) | 2020.05.18 |
재택근무의 명암(明暗) (0) | 2020.04.24 |
꼬북칩과 미국 공산품의 날짜 표시 (0) | 2020.04.07 |
코로나 19와 미국 현지 분위기 (0) | 2020.04.06 |
댓글