분류 전체보기105 [R 데이터 시각화] 워드클라우드 (Wordcloud) 만들기 R로 워드 클라우드 만들기 (tidytext)- 도널드 트럼프 취임사 2018년 11월 21일 예전에 빅데이터라는 말이 이제 막 유행을 했을때 본인을 빅데이터 전문가라고 스스로 팔고다니는 사람들이 많았는데, 그 사람들이 방송에서 제일 많이 보여줬던 것이 이 워드클라우드라는 것이다. 워드클라우드는 그냥 비정형 데이터 종류의 하나인 텍스트 데이터를 의미단위(tokenize)로 구분해서 빈도 별로 가중치를 줘서 Plot을 하는 것에 불과하다. 통계학, 머신러닝 지식도 없이 이런거 만들고 빅데이터 전문가 소리를 들었으니… 참 돈 벌기 쉬웠을때였다 싶다. 잡설이 길어지니 이에 대한 썰은 나중에 쓰는 것으로 하자. 필요한 패키지 library(readr) library(wordcloud) ## Loading req.. 2018. 11. 22. [머신러닝] 정규화 (Regularization) PRML 예제 구현 [머신러닝] 정규화 (Regularization) PRML 예제 구현 regularization 정규화 (Regularization)¶By Sooyeong Lim 이 노트는 Bishop의 PRML 정규화 예제 그림 1.7& 1.8에 대한 설명과 Python 구현이다. In [1]: #Import packages import numpy as np import pandas as pd import random import math import matplotlib.pyplot as plt %matplotlib inline from matplotlib.pylab import rcParams import sklearn rcParams['figure.figsize'] = 12, 8 # Set up the size o.. 2018. 11. 18. [2018 Spring break- 뉴욕 여행] 2. 컬럼비아 대학교, 뉴욕 공립도서관, 월스트리트, 한인타운 Columbia University 숙소를 잡은 곳에서 컬럼비아대학교가 멀지 않아 먼저 여기를 가보기로 했다. 비록 북쪽 할렘 근처이지만 땅값이 비싼 뉴욕 맨하탄에 위치해서인지 학교가 그렇게 크지는 않았다. 아이비리그 학교 중에 하나인 이곳은 뉴욕이 주는 지리적인 장점때문에 NYU와 더불어 미국 수험생들에게 인기가 굉장히 높은 학교이다. 콜럼비아도 관심있는 박사 프로그램이였기 때문에 분위기도 살펴볼겸 학교를 둘러보기로 했다. -컬럼비아 대학교 도서관, 내 모교 경희대에도 도서관 앞에 저렇게 똑같이생긴 ALMA MATER 동상이 있다. -컬럼비아대학교 도서관 맞은편에서 본 경관. 명문대답게 관광객들이 많다. 도시에 캠퍼스를 세워서 어쩔 수 없었는지 생각보다 캠퍼스가 화려하고 이쁘지는 않았다. 내가 만약 여.. 2018. 9. 30. [잡썰] 통계학 관련 유용한 웹사이트, Youtube 채널 - Stanford Lagunita에 공유된 Stephen Boyd's Convex Optimization. OCW 덕분에 수업료를 내지 않고도 어디서나 공부할 수 있는 시대가 왔다. 인터넷 덕분에 성공한 사람들의 이야기를 내가 그들의 지인이 아니여도 전수 받을 수 있는 경로가 생겼다. 비록 간접적인 경험이기는 하지만 실제로 필드에서 일하고 있는 사람들의 경험을 들으면서 내가 무엇에 집중하고 준비해야하는지 알 수 있었고, 필드에 나간다면 어떤 일을 하는지 감을 잡을 수 있었다. 하지만 어디까지나 자료들은 참고용이고 모든 결정에 대한 책은 본인이 진다는 것을 명심하자. Open Course Ware 코세라 https://www.coursera.org/ Stanford Lagunitahttps://lagun.. 2018. 9. 3. [잡썰] 직장이 아닌 직'업'으로의 전환 - 처음 Ohio에 왔을때 묵었던 Hilton Double Tree Hotel 최고의 직장이 답은 아니다 취업 준비를 해보고 또 괜찮은 회사에서도 일을 해보고 나서 느낀 점은 좋은 직장이 꼭 정답은 아니라는 점이다. 같은 직장에서라도 팀마다 분위기가 판이하게 다를 수도 있고, 그 직장이 나한테도 좋은 직장이라는 보장이 없기 때문이다. 가끔 한국에 있는 친구들과 이야기를 해보면 다들 대기업, 공기업 같이 좋은 직장에 들어가려고 노력을 하지만 막상 경쟁을 뚫고 좋은 직장에 있는 친구들도 행복하지는 않아 보인다. 그들도 저마다 미래에 대한 불안감을 느끼고 직장생활에서 방황한다. 내 경우에는 다른 것 보다 조직생활이 주는 불편함과 내 시간, 에너지를 돈과 바꾼다는 생각이 드문드문 들었고, 내가 여기서 잘나봐야 .. 2018. 9. 3. [2018 Spring break- 뉴욕 여행] 1. 출발 타임스퀘어, 뉴욕의 거리, 센트럴 파크 Spring break- 뉴욕 여행기 미국에 온지 반년 이 조금 더 지났을때, 나는 미국의 시골 생활과는 맞지 않는 사람이라는 것을 깨달았다. 난 서울의 번잡함을 참 싫어 했었는데, 사람 구경 하기 힘든 시골에 와보니 오히려 서울이 그리웠다. 뭐든지 적당한게 좋다... 게다가 나는 차가 없었기 때문에 오하이오의 College town에서 거의 섬 사람처럼 생활을 했었던 것 같다. 이렇게 지내는것이 뭔가 억울해 충동적으로 Spring break 기간동안 뉴욕에 다녀오기로 했다. 도시 중의 도시, 영화에서 수 없이 나오던 뉴욕 거리의 모습을 직접 한 번 느껴보고 싶었다. 내가 사는 곳 근처의 CVG 공항에 Allegiant 같은 저가 항공사가 100달러 내외의 가격으로 뉴욕구간을 운영하고 있었고 비행 시간이.. 2018. 7. 12. [잡썰] 미국 생활- 글쓰기의 중요성 미국 생활- 글쓰기의 중요성 미국 직장생활에서 거의 대부분의 커뮤니케이션은 글쓰기로 이루어 진다. 간단한 이메일 부터 시작을 해서 분석 리포트, 논문을 쓰는 것까지 글쓰기가 필요하지 않은 곳이 없는데, 외국인으로 직장생활을 하면서 미스 커뮤니케이션으로 불이익을 받지 않으려면 이 부분에서 더 프로페셔널해질 필요가 있다. 이메일의 어색한 어법이나 실수가 직장 동료나 클라이언트에게 신뢰성을 주지 못할 수도 있고, 이로인해 내 자신의 가치/포텐셜보다 낮은 평가를 받을 수도 있기 때문이다. 나의 경우엔 연구 논문을 쓰기 시작하면서 글쓰기 능력이 왜 중요한지를 절실하게 느꼈다. 문장 하나 하나에는 논리적인 연결고리와 충분한 배경설명이 있어야 하고, 결국은 이 모든 과정들이 타인을 설득하기 위한 과정이라는 것이다. .. 2018. 7. 12. [데이터 사이언스 인턴] 롯데멤버스 통계분석 직무 동계인턴 면접+엘텝 합격 후기 [데이터 사이언스 인턴] 롯데멤버스 통계분석 직무 동계인턴 면접+엘텝 합격 후기 지원동기 서울대학교 융합과학기술원에서 여름 방학동안 데이터 사이언스 랩에서 인턴을 하면서 데이터 마이닝, 머신러닝 알고리즘이 어떻게 실제 비즈니스에서 이용되는지가 알고 싶어졌다. 대학원을 차후에 가더라도 회사에서 일을 한번 해 보고 진학을 하면 선택에 후회가 없을 것 같다는 생각이 들었고 아무런 사회 경험 없이 대학원에 진학해서 후회하는 사람을 자주 목격을 한 것도 입사지원을 하게 된 계기가 되었다. 마침 친한 친구가 다니고 있는 롯데멤버스라는 회사에서 내가 생각하고 있는 업무를 한다는 것을 듣고 통계분석 직무-동계 겨울 인턴으로 지원을 하게 되었다. 롯데멤버스는 롯데그룹 중에서도 학벌을 제일 많이 본다는 계열사라고 들었고 .. 2017. 12. 17. [데이터 사이언스 인턴] 서울대학교 융합과학기술원 Applied Data Science Lab 인턴 후기 데이터 사이언스 인턴- 서울대학교 융합과학기술원 Applied Data Science Lab 인턴 후기 2016년 여름 나는 서울대학교 융합과학기술원 대학원 Applied Data Science Lab(ADSL)에서 인턴을 하였다. 이미 2년 가까이 지난 이야기이지만 내가 대학원 진학을 결정하고, 후에 데이터 사이언스 분야에 취업을 할때 상당히 많은 도움이 된 귀중한 경험이였기 때문에 기억을 더듬어서 이때의 경험을 정리해보고자 한다. - 신청동기 & 과정 지원 전 학기에 서울대학교 융합과학기술원에서 진행하는 인공지능 컨퍼런스도 참가해보고 대충 어떤 연구실이 있는지는 알고 있었지만 이제 막 이 분야를 공부하는 입장이라 각 연구실에서 어떤 연구를 하는지에 대해 세세한 내용은 잘 모르고 있었다.4학년 1학기가.. 2017. 12. 17. 이전 1 ··· 7 8 9 10 11 12 다음