>RE::VISION CRM

카테고리 없음

[교육 행사 후기] R을 이용한 데이터 분석 입문

YONG_X 2012. 7. 4. 18:23

2012년 6월

[빅데이터분석 교육] R을 이용한 데이터 분석 입문

         - 강의 진행 후기 -

 

6월 27일 강남역 TOZ에서  ECG의 김경태 대표의 강의로 7시간 동안 R을 이용한 데이터분석 강의가 [리비젼아카데미] 주최로진행되었다. 간략하게나마 강의에서 이루어진 내용을 요약해 본다.

 

강의의 앞부분에서는 빅데이터, 데이터 사이언스 등 최근 주목 받고 있는 [빅데이터 분석]과 관련된 전반적인 흐름에 대한 소개가 있었고, 후반에는 오픈소스 소프트웨어 R을 이용한 다양한 데이터 분석을 하는 방법이 설명되었고 실제 분석과정에 대한 시연도 이루어졌다.

 

강의에서 특히 비중있게 다루어졌던 부분은 소셜네트워크서비스 트위터 twitter 등으로 부터 데이터를 수집한 후 이에 텍스트 마이닝을 적용하여 중요한 키워드를 추출해 내어 시장동향을 파악하는 분석 부분이었다.

그 외에도 R을 이용한 데이터 마이닝 계열의 분석을 하거나, 다양한 그래프를 이용한 Visualization을 하는 방법도 설명되었다.

 

오픈소스 소프트웨어 R

 

강의를 통해 설명된 [R]이라는 소프트웨어는 누구나 자유롭게 사용할 수 있는 오픈소스 소프트웨어였다. 다양한 통계분석과 그래프 작성, 신축적인 데이터 처리를 위한 종합적인 환경과 언어를 제공한다. 최근의 빅 데이터 분석 붐에서 빠지지 않고 언급되고 있고 사용하는 국내외 대기업이 급속도로 증가되고 있는 추세이다.

강의에서 보여진 R은 다양한 그래프를 통해 데이터로 부터 인사이트를 찾아내는 과정을 도와주는 측면에서 많은 가능성이 있음이 확인된 듯 하다. 많은 종류의 모델링 알고리즘을 사용할 수 있다는 점도 높이 평가될만해 보였다.

 

누가 R을 배워야 할까?

 

통계적 데이터 분석에 익숙하지 않은 사람들과 프로그래밍 경험이 전혀 없는 사람들의 경우 R을 쉽게 배워서 편하게 자신의 업무에 적용하기는 용이하지 않을 수 도 있을 듯하다. 통계학 관련 전공으로 공부한 사람이 아니더라도 실무에서 데이터 분석을 업무로 하고 관련된 소프트웨어를 직접 운영해본 경험을 가진 사람이 주된 대상이 될 것 같다. 문제는 국내 상황을 보면 기업내에서 데이터 분석을 주업무로 해서 심층적인 데이터 분석 일상적으로 수행하는 인원이 그리 많지 않다는 점인 듯 싶다. R이든 아니면 다른 소프트웨어이든 간에 데이터 분석이 확산되는 것이 매우 중요할 것 같다. 그런 점에서 본다면 근래의 빅데이터 분석 붐과 관련하여 데이터 분석 자체가 양적으로나 질적으로나 확산되고 보편화되는 계기가 마련되어야 할 필요가 매우 큰 것 같다.  

 

향후 R을 활용하는 교육은 어떻게 진행되면 좋을까?

 

R을 실제로 활용할 수 있도록 하려면 데이터 분석에 대한 경험을 가진 사람이라고 하더라도 몇일 과정은 될 필요가 있을 듯 하다. 시간적으로 하루내에 R이라는 환경을 소개하고 분석에 사용하도록 가르치기에는 일정이 빠듯할 수 밖에 없어 보였다. 최소 이틀 정도의 시간을 통해 기본적인 기능들을 사용하기 위해 필요한 개념과 문법, 명령어 등을 실습과 더불어 공부하도록 구성해야할 필요가 있을 듯 했다.

기본적인 입문과정과는 별도로 응용과정이 따로 개설될 필요가 있어 보였다. 예를들면 R을 이용한 예측모델링, R을 이용한 소셜데이터 분석 등과 같은 응용 분야별 과목이 반나절이나 하루 단위로 개설되면 관심있는 사람이 선택해서 들을 수 있을 듯하다. 소프트웨어 기능 자체를 설명하는 것은 쉬울 수 있으나 업무에 응용하는 것에 대한 교육을 쉽게 찾아볼 수 없다는 점에서 이런 응용 교육의 필요성은 매우 큰 것 같다. 또, R 자체와는 별도로 빅데이터 분석과 데이터 사이언스 (data science) 전반을 다루면서 R을 통한 분석 고도화도 설명하는 [데이터 사이언스 전략 세미나]와 같은 타이틀의 세미나 형태의 과정도 개설된다면 좋겠다고 생각되었다.

 

강의를 주최한 리비젼아카데미 입장에서도 처음 개설한 과목이었기에 아쉬움과 교훈도 많이 남긴 행사였다. 빅데이터 분석이나 데이터 사이언스가 단순간에 사라질 일시적 유행만은 아니라면 분명 R을 이용한 데이터 분석에 대한 강의도 활발하게 개최될 필요가 있으리라 판단된다. 향후에는 좀 더 짜임새 있게 목적을 조금더 구체화한 강의를 진행해봐야 하겠다는 교훈과 숙제가 남는 것 같다.  

 

- 끝 -

* 이 글은 http://cafe.daum.net/revisioncrm 리비젼아카데미 카페에서도 보실 수 있습니다.