본문 바로가기
Career/잡썰

[잡썰] 데이터사이언스 프로그래밍 언어의 선택 R, Python, SQL, SAS .. etc

by Data_to_Impact 2017. 9. 25.
반응형

-처음 프로그래밍 언어를 배우는 과정은 고되다. 하지만 남들이 짜놓은 코드를 따라해보고 본인만의 아이디어를 적용해보다 보면 재미도 느낄 것이고 성취감이 드는 순간이 온다.



 처음 데이터사이언스 분야에 입문하는 사람이라면 누구나 도대체 어떤 언어를 공부해야 할지 궁금해 할 것이다.



나 또한 그랬으며, 사실 이 언어라는 것이 하나를 제대로 해놓으면 다른 분야로는 전환하기가 굉장히 쉬움으로 사실 어떤 언어를 시작해도 상관은 없다.


하지만 개인적인 경험으로는 Python을 먼저 General 한 언어에 대한 이해를 가지고 난 이후에 SAS나 R 처럼 통계를 위해 특화된 언어를 배우는 것이 실력의 향상 면에서나 배움의 면에서나 훨씬 효율적인 것 같다.


R이나 SAS를 먼저 배우고 Python을 배울 수도 있지만, General한 내용을 배우고 나면 사실 R 이나 SAS는 이런 General 한 코드를 사용자가 이용하기 쉽게 바꾸어 놓

은것에 불과하다는 것을 느낄 것이다.


R은 무료 소프트웨어이고 패키지 사용이 간단하기 때문에 많은 이용자가 사용중이고, SAS는 유료이고 비싸지만 Experimental Design부분에 강력한 성능을 보이고 신뢰성 때문에 대기업이나 제약회사에서는 여전히 SAS를 쓰고 있다.  이런 통계 툴을 공부할때는 자신이 일하고 싶은 회사나 산업이 어떤 툴을 주로 이용하는지 알고 준비하는 것이 좋다. 금융쪽이라면 Python& C++을 주로 쓴다고 들었고, Software회사에서는 Python을 주로 쓴다고 한다. 


SQL은 데이터베이스에서 필요한 자료를 추출하기 위한 언어인데 데이터베이스 내 정형데이터를 처리하는데 필수적이다. 어쩌면 취업을 하고 난 이후에는 가장 많이 써야할 언어가 될수도 있다. 해외 데이터 사이언스 인터뷰에 꼭 SQL 쿼리 짜는 것은 물어본다고 한다. 


Python -> SAS or R -> SQL 순서로 준비한다면 데이터를 가지고 분석업무를 할 수 있는 기본 준비가 되었다고 생각한다. 이후 본인의 진로에 따라 머신러닝이라던가 딥러닝을 할 것이면 Google의 Tensorflow나 케라스 같은 프레임워크를 이용하면 된다. 이런 라이브러리들도 보통 Python 기반으로 코드가 짜여져있기 때문에 본인은 먼저 Python을 공부하는 것을 추천한다.


만약 아직 학교에 재학중이라면 프로그래밍 기초수업을 먼저 듣고 여력이 된다면 컴퓨터공학과의 자료구조, 알고리즘, 고급객체 지향 수업을 듣는 것을 추천한다.  사실 이 정도 준비가 되면 본인이 할 수 있는 역량이 상당히 많을 것이고, 일자리를 못구해서 걱정할 일은 없을 것이다.


당부하고 싶은건 한 언어를 시작하면 그 언어의 실력을 어느정도 수준까지 올리는데 노력을 할애해야 한다. 이거 조금하고 저거 조금해서는 실력이 늘지 않는다. 한 언어를 공부하고 그 언어로 프로젝트를 한 이후에 다른 언어를 배울때 배우는 언어를 가지고 이전에 했던 프로젝트를 다시 구현해보는 것도 도움이 된다.


반응형

댓글