>RE::VISION CRM

빅데이터

[빅 데이터] 데이터 사이언티스트 : 전망, 현실 그리고 과제

YONG_X 2013. 4. 10. 19:04

 

데이터 사이언티스트의 미래: 전망, 현실 그리고 과제

 

전용준 리비젼컨설팅 대표/ 경영학 박사

xyxonxyxon@empal.com

 

빅 데이터가 중요한 키워드로 부상하면서 빅 데이터라는 고성능의 전투기를 조종할 데이터 사이언티스트라는 파일럿에 대한 관심이 높아졌다. 파일럿이 없이 비행기가 하늘을 날 수 없으며 유능한 파일럿은 전투기 보다 값어치가 커서 전투기를 버릴 망정 파일럿만큼은 살리려고 하는 것과 마찬가지로 빅 데이터를 분석하기 위해서는 없어서는 안될 핵심자원이기에 절대적인 가치가 있다고 생각하는 것이다. 데이터 분석의 전세계적 구루로 불리는 토마스 데이븐포트 교수와 데이터 사이언티스트라는 용어의 창시자로 불리는 D.J. Patil이 함께 작년 하바드비지니스리뷰에 기고한 글은 데이터 사이언티스트가 21세기의 섹시한 잡이라는 화려한 제목을 가지고 있을 정도이다. 이런 흐름에 부응해서 대학의 여러 교수님들은 많은 제자들을 데이터 사이언티스트로 만들고자 하는, 마치 임진왜란에 대비해 십만양병을 생각하는 것과도 같은, 사명에 가득한 꿈을 가지기도 하고, 젊은 학생들은 좋은 대우와 멋진 경력을 제공할 것이라는 기대와 함께 데이터 사이언티스트를 미래의 자신의 모습의 후보 중 하나로 심각하게 고려하는 경우도 부쩍 늘어나는 것 같다.

 

그렇다면 데이터 사이언티스트는 대체 얼마나 많이 필요한 것일까? 작년에 만들어진 한국정보화진흥연구원의 자료를 비롯한 많은 자료에서 인용되고 있는 매킨지의 2011년 조사에서는 2018년을 기준으로 데이터 분석 스킬을 가진 인력이 미국에서만 50만명이 필요하지만 30만명의 공급이 가능할 것으로 전망된다고 했다. 심각한 수급불균형이 예상된다는 것이다. 정확하게 일치하지는 않겠지만 이는 인구 1천명 중 한명 꼴에 해당한다는 점에 미루어 우리나라에서도 같은 시기에 5만명 수준의 수요가 있을 것이라는 대략적인 추산이 가능할 것이다. 국내에서 연간 50만명이 대학을 졸업한다고 보면 그 중의 1%에 상당하는 5천명 정도가 향후 5년간 매년 공급된다고 하면 어쩌면 추정한 수요의 절반 정도에 해당하는 인력을 공급하는 것 까지는 가능할 것이다. 역시 한국내에서도 엄청난 수급 불균형은 피할 수 없다는 계산이다.

그러나 이 숫자가 과연 데이터 사이언티스트에 대한 수요를 나타내는 것이라고 할 수 있을까? 그리고 그 수요를 충족하는 공급이 이루어진다고 했을 때 장기적으로 그 데이터 사이언티스트들은 어떤 미래를 맞게 될까? 데이터 사이언티스트에 대한 정의와 자격요건에서부터 출발하여 좀 더 구체적인 검토를 통해 어떤 데이터 사이언티스가 얼마나 공급되는 것이 현실적으로 적절하고 가능할 것인가를 짚어볼 필요가 있다는 생각이 든다.

 

 

데이터 사이언티스트의 자격요건과 그에 따른 보상

 

데이터 사이언티스트라는 직업을 규정하면서 공통적으로 이야기하는 것은 프로그래밍에 대한 기술과 동시에 통계적 내지는 수리적인 데이터 분석에 대한 체계적 지식을 가지고 있어야 한다는 점이다. 여기에 어떤 영역에서 어떠한 유형의 문제가 주어지든 데이터를 통해 해결할 수 있기 위해 폭넓은 일반적 상식과 인문, 사회, 경제 측면에 대한 이해, 그리고 팀과 경영진 내지는 고객들과 원활하게 소통할 수 있는 뛰어난 커뮤니케이션 능력도 있어야 한다고 한다. 그리고 실험과 탐구를 반복하고자 하는 호기심이라는 과학자적인 기질도 있어야 한다고 한다. 대부분의 경우 수학, 통계학 또는 공학 관련 박사학위를 가지고 있는 것이 기대된다. 이 정도 조건을 충족한다면 가히 수퍼 영웅이라고 불러도 될 것 같다는 생각이 들지 않는가? 어느 시대, 어느 나라를 막론하고 과연 얼마나 많은 수의 사람이 이 정도의 자격요건을 만족하겠는가?

이런 수퍼 영웅이 어느 정도 존재한다고 해도 그들에 대해 과연 어떤 정도의 대우를 해줄 수 있겠는가? 특히 젊은 학생들이 데이터 사이언티스트를 생각할 때는 좋은 대우의 선망하는 직업의 하나로서일 것이다. 자본주의 사회에서 일이 가지는 가장 큰 의미는 경제적 보상이라는 점을 인정한다면, 충분한 대우가 없다면 단지 도전적인 새로운 일이라는 점만으로는 충분히 매력적이지 않을 것이다. 분명 이 대우와 관련된 문제는 그들이 속해서 일하는 조직 내에서 어떠한 일을 실제로 수행하며, 그 결과로 조직에 얼마나 큰 가치를 줄 수 있는가에 따라 달라질 것이다.

 

데이터 사이언티스트는 대략 두 가지 종류의 역할을 수행하는 것으로 이야기 된다. 하나는 데이터를 분석하여 조직의 활동 방향을 제시하는 것이다. 결과만 본다면 흔히 조직내 스탭들이나 경영 컨설턴트들이 맡아 하던 일과 유사하다. 다만, 이전에 스탭들과 컨설턴트들도 수행하던 수준의 단순하고 매우 요약적인 수준의 데이터 분석이 아닌 대량의 다양한 데이터를 사용한 심층적인 데이터 분석을 핵심적인 수단으로 사용한다는 점에서 과정과 수단적 측면에서 상당한 차이는 있다. 이 차이로 인해 그 조언의 가치와 유용성이 기존의 스탭들과 컨설턴트들에 의한 것을 월등히 초월하는 것이 기대된다. 또 한가지 종류는 시스템이나 프로세스를 만들어 내는 일이다. 대표적으로 아마존에서 개인화 어플리케이션을 만드는 것과 같은, 조언이나 보고의 측면이 아닌, 시스템 개발에 가깝고 직접적이고 가시적인 산출물이 드러나는 작업들이 이에 해당한다. 무언가를 만들어 냈다는 가시적인 측면의 성취감도 만들어지는 대목이다. 문제는 이런 종류의 작업에 대해서 조직이 지불할 수 있는 대가가 얼마나 될 것인가 하는 점이다. 흔히들 말하는 것처럼 좋은 대우를 해 주려면 어쩌면 경영진 보다도 좋은 대우를 받아야 할지도 모른다. 과연 현실적으로 이런 것이 가능할까? 그것도 한국이라는 나름의 특성이 있는 기업과 조직의 문화안에서? 지난 십여년의 실무 경험 과정을 되돌아보면 무언가 큰 변화가 필수적이 아닐까 하는 생각을 지울 수 없다.

 

 

미국이라는 특수한 시장에서의 데이터 사이언티스에 대한 이해

 

실제로 누가 처음 이 용어를 생각해내었는가를 따지기 이전에 데이터 사이언티스트라는 개념은 미국에서 태생된 것으로 보는 것이 적절할 듯하다. 이미 십년 전에도 아마존에서는 수석 데이터 마이닝 사이언티스트라는 직함을 가진 사람이 존재했었다. 일류 대학 교수 출신이었고 아마존에서 수년간 일한 이후에는 독립컨설턴트로 일하다가 다시 또 다른 일류 대학 교수로 자리를 옮겼다. 미국이라는 특수한 시장은 대규모의 자본을 가지고 있을 뿐 더러 수많은 IT벤쳐 기업들을 가지고 있다. 이 벤쳐 기업들은 자본시장으로부터 수년간의 연구개발에 의욕적으로 투자할 수 있을 정도의 대규모의 자금을 끌어들여 획기적인 신상품을 개발하고 있다. 일을 수행하는 인력의 수가 아니라 아이디어가 중심이 되고 일단 성공적인 상품만 만들어진다면 전세계라는 어마어마한 시장이 기다리고 있다. 참고로 최근 내한한 오페라솔루션즈의 임원분 이야기를 들어보면 자사내에 수백명의 데이터 사이언티스트를 보유하고 있다고 자랑한다. 조직 전체 인력의 삼분의 일 이상의 인원을 데이터 사이언티스트로 채우는 전문회사도 존재 가능하다는 것이다. 이러한 환경은 최고 수준의 데이터 사이언티스트를 요구할 수 있는 기회를 제공한다.

앞선 한 예에서처럼 일류 대학 교수라는 안정적인 직업을 접고 실무로 전향할 수 있을 만큼 거창한 도전과 그에 걸맞는 대우가 동시에 주어질 수 있다. 그만큼의 시장이 존재하기 때문에. 또 한편으로는 절대수 측면에서 충분한 인력풀의 공급이 가능하다. 우리나라 뿐 아니라 인도, 중국, 일본 등을 포함한 전세계에서 공부하기 위해 미국으로 가고자 한다. 또 공부를 마치면 그 시장에 남아 일하고자 한다. 그들 중 걸러지고 걸러진 소수의 인력들이 미국 기업에서 데이터 사이언티스트로 일할 수 있는 후보가 되는 것이다.

 

물론 뛰어난 데이터 사이언티스트가 존재한다고 했을 때 그가 한국이라는 특정한 나라에서 성장하고 현재 한국에서 일하고 있다고 해서 그에게 더 큰 시장으로 진입할 수 있는 기회가 완전히 막혀있다고 할 수는 없을 것이다. 하지만 현실적으로는 언어적인 장벽, 일반적인 사회와 문화적 경험, 조직환경에서의 업무와 문화적인 경험 등에서의 차이 등 여러 요인이 세계 시장에서 원활하게 자리를 옮겨 다닐 수 있는 유동성을 가지기에는 큰 제약으로 작용하는 것은 분명해 보인다. 반면 우리나라에 비해 비즈니스 측면에서 세계시장에 많이 개방된 영어권의 국가들 즉, 유럽과 호주, 인도 등은 상황이 우리와는 사뭇 달라 보인다. 자국내에서의 시장이 크지 않다고 해도 능력이 있는 경우 미국이라는 빅 마켓을 오가는 것에 큰 제약이 없는 듯 하다. 게다가 인도로 대표되는 소위 수학적 능력이 태생적으로 뛰어나다고 이야기되는 민족들의 성향이라는 부분도 상당한 영양요인으로 작용하는 듯하다. 실례로 KDnuggets.com에 게시된 데이터 사이언스 A-list , 최고의 데이터 사이언티스트 Top 10 목록이나 주요 인공지능 또는 기계학습 관련 학술 논문집에 논문을 발표하는 사람들의 목록, 또는 빅 데이터와 관련된 컨퍼런스 발표자들의 목록을 보면 인도 쪽 출신이 많이 포함되는 모습을 흔히 볼 수 있다.

 

 

데이터 사이언티스트가 성과를 낼 수 있을까?

 

데이터 사이언티스트가 성과를 내려면 조직이 성과를 낼 수 있는 환경과 대우를 제공해야 할 것이다. 정확히 데이터 사이언티스트의 자격요건을 충족하지는 못한다고 하더라도 비슷한 역량을 가지고 비슷한 역할을 수행하는 데이터 분석가들은 여러 조직에서 비교적 흔히 볼 수 있다. 데이터 사이언티스트에게 요구되는 바와 별 차이 없이 다양한 데이터를 종합해 분석하고 그 결과를 조직내에 필요로 하는 부문 내지는 경영진에게 보고하는 임무를 수행한다. 그러나 그들은 실리콘밸리의 데이터 사이언티스트들과는 전혀 다른 분위기에서 일한다. 심오한 탐구 보다는 상대적으로 단순한 보고서를 짧은 시간에 만들어 내는 것으로 평가 받는다. 이미 결론이 정해진 분석 과제에 대해 그것에 끼워 맞춰진 답과 설명을 보충하는 것으로 일이 한정되기 일쑤이다. 필요하다고 해도 주어진 데이터 이외에 새로운 데이터를 조직의 비용을 들여 확보하는 것이 허락되지 않는다. 분석의 일환으로 업무적인 실험이 필요하다고 해도 그것을 요청하기 어렵다. 데이터 분석가는 원한다고 해도 그 분석을 수행해볼 기회를 얻기가 쉽지 않으며, 능력이 있다고 해도 그런 분석을 수행할 시간적인 여유를 제공받지 못한다. 분석의 결과물에 대한 확신이 있다고 해도 최고위층의 경영진에게 직접 그 내용을 어필할 기회도 흔히 주어지지 않는다. 업무의 내용에 얼마간의 차이가 있을 뿐 은행 점포의 창구 직원과 크게 다를 바 없는 단순 반복적인 업무로 아침에서 저녁까지의 시간을 보내게 된다. 그들의 분석가적인 호기심은 시간이 지날수록 사라질 수 밖에 없다. 이들 중 뛰어난 데이터 사이언티스트로서의 자질을 가진 사람이 있다고 해도 그 역량이 발전되기 보다는 퇴화되기 쉽다. 반면 조직은 주어진 환경이야 어떠했던 간에 결과적으로 데이터 분석가가 조직에 기여하는 비중이 크지 않기 때문에 그들을 중추적인 인물로 여기기 보다는 보조적인 인물로 여기게 되고 그들에게 많은 보상을 제공하는 대신 그저 평이한 보상을 제공한다.

 

 

이러한 환경에서는 기존의 데이터 분석가가 아니라 새로운 스타일의 데이터 사이언티스트가 같은자리에 바꿔 앉는다고 해도 크게 달라질 가능성은 없다. 최근 새로운 정부의 출범과 더불어 빅 데이터에 대한 정책적 관심이 커지면서 많은 공공기관들이 빅 데이터 프로젝트를 추진하려는 모습을 보이고 있다. 그럼에도 그 프로젝트들의 중심에 필수적으로 존재해야 할 데이터 사이언티스트의 자리가 존재하는가에 대해서는 의문이 든다. 유능한 데이터 사이언티스트를 운 좋게 참여 시킬 수 있는 경우라고 해도 IT와 관련된 대부분의 공공부문 프로젝트들이 그렇듯이 주단위 일정관리와 보고, 근태관리가 새로운 업무 스타일에 익숙한 데이터 사이언티스트들의 창의적인 문제해결 프로세스를 지속적으로 방해할 것이다. 또 원대한 비전에서 출발하는 빅 데이터 프로젝트라고 해도 인력에 지급 가능한 인건비는 여느 시스템 구축 프로젝트에서의 수준에서 벗어나기 어려울 것이다. 데이터 사이언티스트가 들어올 여지도 없고 들어온다고 해도 버텨낼 수가 없는 구조임에 분명하다. 그들이 그 곳에 있을 수 없기에 성과를 내는 것은 당연히 불가능할 수 밖에 없다. 또 그 결과로 수많은 빅 데이터 프로젝트는 기대만큼의 성과를 내지 못할 것 같다는 불길한 예감이 드는 것도 사실이다.

 

 

데이터 사이언티스트의 미래는?

 

 

빅 데이터가 중요한 키워드로 유지되는 동안 데이터 사이언티스트에 대한 수요는 지속적으로 존재할 것으로 생각할 수 있다. 그러나 빅 데이터라는 키워드가 초창기인 지금 만큼의 관심을 앞으로도 꾸준히 계속 받을 것이라고 확신하기는 어렵다. 모든 관심은 초창기에 집중된다는 것을 이미 여러 번 경험한 만큼 빅 데이터의 미래도 굴곡이 있을 것이라는 것은 쉽게 예상할 수 있다. 1970~80년대의 공학에 대한 관심이나 2000년대 초기의 게임 등 컨텐츠에 대한 붐은 좋은 사례가 될 수 있을 것이다. 핵물리학자나 첨단 공학자들이 모든 아이들에게 부모가 바라는 장래 직업이었던 시절이 있었다. 컴퓨터 게임 개발이 차세대 산업으로 수많은 일자리를 만들어 낼 것이라는 기대가 있었던 적도 있었다. 그러나 그 모두가 시대적인 유행을 탔고, 공급이 수요를 초과하는 조정 과정을 겪었다. 이런 변화가 데이터 사이언티스트라는 새로운 유형의 일자리에도 나타날 가능성을 간과할 수 없다.

지금도 게임이나 컨텐츠를 개발하는 기업들을 방문해서 보면 많은 젊고 자유분방한 창의성 넘쳐 보이는 인재들이 그 안을 채우고 있다. 그러나 그들이 그런 특수한 환경에서 일할 수 있는 기간은 그리 길 것으로 예상하기 어렵다. 마치 프로야구 선수들처럼 그들은 창의성이 고조에 이르는 일정한 기간 동안 평생 몫의 성과를 내야 한다. 학교에서부터 마이너리그 생활까지 오랜 고통을 참고 겨우 몇 년간의 메이저리그 생활로부터 평생을 보장받아야 한다. 그다지 많은 시간이 주어지지 않는 것이다. 마찬가지로 데이터 사이언티스트도 수명에 한정이 있을 것이라는 생각을 하게 된다. 극소수의 A급 인력을 제외한다면 데이터 사이언티스트라는 종목에서 일하던 많은 이들이 장기적으로는 그 일을 그만두게 될 가능성이 높아 보인다. 필요로 하는 공부를 마치고 난 20대 후반에서부터 약 십년 정도의 기간 동안 의욕적으로 열정을 불태울 기회가 주겠지만 그 이후까지는 아닐 수 있다. 그들이 수행하는 일의 성격 자체가 극도의 창의성을 요구할 뿐만 아니라 경우에 따라서는 수 없는 밤을 지새는 고된 육체적인 노동도 수반하기 때문이다. 40대에 들어서면서 데이터 사이언티스트 중 많은 수는 자신이 해오던 일의 대부분을 후임자에게 넘겨주고 관리자나 경영자로 종목을 변경해야 할 것이다. 그것이 여의치 않은 경우라면 전혀 새로운 분야로 전환하는 것이 불가피할 것이다.

이런 사실들을 생각해 보면 요즈음 데이터 사이언티스트의 양성을 부르짖는 분들의 그림 속에 당장의 유행을 충족시킬 필요에 의해 육성하고자 하는 그 대상이 되는 사람들의 장기적인 미래에 대한 고민이 얼마나 구체적인가에 대해서는 의문이 든다. 향후 5년간의 수요가 공급을 초과할 것이다라는 단순한, 그것도  추측만으로는 여러 사람들의 미래가 걸린 도박이 큰 설득력이 없는 듯 싶다. 

 

 

실제로 어떤 데이터 사이언티스트가 얼마나 많이 필요한가?

 

데이터 사이언티스트에 대한 획일적인 환상이 먼저 깨져야 한다. 수많은 자격요건을 모두 충족하는 데이터 사이언티스트는 그리 많은 수가 생산되는 것이 불가능하다. 그런 수퍼 영웅은 존재 자체가 불가능하지는 않다고 해도 현실 세계에서 그리 많지 않다. 인구 천명에 한명은 비현실적인 상상이다. 앞서 언급했던 매킨지의 조사에서도 데이터 사이언티스트에 대한 숫자가 아니었다. 만일 수십만명의 데이터 사이언티스트가 공급될 수 있다면 그들은 아마도 지금 우리가 상상하는 수준으로 자격요건을 충족하는 사람들일리가 없다. 매킨지가 이야기하는 분석 기술을 가진 사람들은 지금도 우리가 조직내에서 쉽게 볼 수 있는 분석업무에 전문성을 좀 더 가지고 있는 사람들 정도일 것이다. , 데이터 사이언티스의 자격요건 즉, 넓은 영역에 대한 기술과 지식, 그리고 다양한 업무에 대한 분석 능력을 가진다는 점을 충족하는 인력이라고 해도 냉정하게 이야기한다면 등급의 문제가 고려되어야 할 것이다. 지금 우리가 쉽게 상상하는 데이터 사이언티스트는 그 종목에서 A급 인력들이다. 하지만 실제로 공급될 수 있는 인력들은 반드시 A급만으로 구성될 수는 없다. 공급자체가 불가능하기 때문이다.

 

모든 역량을 다 갖추어야만 하는가에 대해서도 이견들이 있다. 작년 한 국내 기사에서도 언급되었던 바와 같이 만일 데이터 사이언티스트가 다섯 가지 역량을 필요로 한다면 그 중 두어가지는 매우 전문적이고 나머지는 기본적인 수준의 역량을 가진 몇 사람이 하나의 팀으로 움직이면서 가치를 발휘할 수 있는 가능성이 있다는 것이다. 이런 발상은 매우 바람직하며 현실적이다. 실제로 아마존에서도 Two-Pizzas-Team 이라는 용어를 사용한다고 한다. 프로젝트 자체의 경제적인 규모와는 무관하게 두 판의 피자를 (야근하면서) 먹을 정도의 작은 팀을 단위로 프로젝트가 진행된다는 것이다. 그 안의 모든 사람이 동일한 역량을 가진 데이터 사이언티스트일 필요는 없을 것이다. 보완적으로 그리 시너지를 낼 수 있는 팀이라면 충분한 생산성이 보장될 수 있을 것이다.

 

우리나라에 A급의 수퍼 데이터 사이언티스트는 천명만 존재해도 기적일 것이라는 생각을 해본다. 이 조차도 원대한 희망일지 모른다. 이들이 수만명의 인력으로 구성된 능력있는 분석팀들을 이끌어 줄 수 있을 것으로 기대할 수 있기 때문이다. 그리고 아마도 미국이라는 큰 시장에서도 십년내에 만명의 A급 데이터 사이언티스트가 양성되기는 어려울 것으로 생각하기 때문이기도 하다.

 

데이터 사이언티스트는 어떻게 키워낼 수 있는가?

 

하루 아침에 데이터 사이언티스트를 자동판매기에서 뽑아내는 커피처럼 만들어낼 수 있을 것이라는 기대는 너무도 비현실적이다. 최근 미국 대학들이 앞다투어 개설하고 있는 프로그램들도 충분한 장기간에 걸친 양성을 표방한다고 판단하기에는 무리가 있어 보인다. 시간이 필요한 것이 분명하다. 하지만 학교에서만 머문다고 해서 데이터 사이언티스트로서의 역량이 배가될 것으로는 보이지 않는다. 실무적인 경험이 아직 충분히 다듬어지지도 않은 이론을 배우는 교실에서의 시간 보다 월등히 중요하다.

 

미국의 학교들이 프로그램을 진행하면서 보이는 특징 중 하나는 이미 데이터 사이언티스트로 불리고 있는 실전 경험을 가진 실무자들이 강의를 맡거나 학교 인근의 기업들과의 협력을 통해 실무를 본격적으로 접할 수 있는 기회가 제공된다는 점이다. 일례로 워싱턴대학의 프로그램은 본사가 인근에 있는 마이크로소프트 연구소의 전문가가 프로그램을 이끌고 있으며 학교가 위치하고 있는 시애틀 주변에 마이크로소프트 외에도 아마존이나 보잉과 같은 기업이 존재하며 이들과 활발한 교류가 이루어진다. 대기업의 임직원들이 대학의 경영대학원 프로그램에서 공부하기도 하고 반대로 기업들이 실무적인 측면의 교육내용을 보완할 수 있게끔 과정을 지원하기도 한다. 책으로만 무예를 배우 사람이 무예를 가르친다고 해서 뛰어난 무술가를 만들어내기는 쉽지 않다. 결국 수많은 실전을 통한 노하우가 이론적인 체계와 만나고 교류해야 발전이 있을 것이다.

 

비단 국내만의 문제는 아닐지도 모른다. 앞서 언급했던 데이븐포트 교수와 Patil의 기고에 대한 하바드비즈니스리뷰 온라인 게시판에도 실무적 사례를 너무 많이 다룬다고 원로 교수에게 질타를 받았던 강사와 이에 공감하며 교과서 내용을 강조하는 통계학 교수님들에 대한 졸업생들의 원성들이 많았다. 결국 기업이 투자해야 한다. 고가의 유료 아카데미가 생겨나야 한다. 이 아카데미에 수강생을 보내는 비용은 기업이 부담해야 한다. 아니면 인력 양성을 위한 재원이 조달될 방법이 마땅치 않다. 물론 고가의 비용에 걸맞는 품질있는 서비스를 아카데미가 제공한다는 전제는 필수겠지만.

 

특히 국내의 상황을 본다면, 지난 십년간의 데이터 분석에 대한 투자대비 성과에 대한 실망으로 인해 투자가 원활하지 못했고 국내 기업들의 규모가 절대적으로 글로벌한 수준이 되지 못하다보니 경험도 기술력도 부족한 부분은 분명 존재한다. 수퍼 영웅을 키워낼만한 선생님들 자체가 거의 존재하지 않는다는 제약을 안고 있다. 결국 이 부분은 국내가 아닌 국제적으로 조달할 수 밖에 없는 부분으로 생각된다. 최근 데이터 사이언티스트를 양성하기 위한 프로그램들이 생겨나고 있으나 그 품질과 실효성에 대한 고민이 남는 부분이다.

 

 

누가 데이터 사이언티스트의 후보가 될까?

 

박사과정 학생? 석사과정 학생? 실무 경험을 가진 직장인? 이런 류의 문제도 더불어 고민해야 할 사항이라 보인다. 최근의 경향으로만 본다면 대체로 박사급의 이론적 지식을 기본으로 요구하는 방향으로 변해가는 것은 분명해 보인다. 상대적으로 학력은 높지 않아도 실무적인 경험이 많은 사람들을 적합하지 않은 것으로 보는 상황이다. 하지만 이 것 조차도 일시적일 수 있다. 장교만 아니라 부사관과 병사도 양성해야 어느 정도의 균형있는 팀을 만들수 있어 보인다. 다만 이미 글로벌한 환경에서 모든 조직이 운영되고 있고 빅 데이터에 대한 분석과 데이터 사이언스 자체가 글로벌한 정보교류 없이는 불가능한 상황임을 전제한다면 개인 자체가 글로벌한 정보획득과 교류가 가능한 역량을 가져야 할 것이다.

 

무엇이 달라져야 하는가?

 

일할 자리와 기회가 먼저 있어야 한다. 데이터 사이언티스트라는 인력이 먼저 만들어 진다고 해도 그들이 일할 자리가 없다면 문제가 발생할 것이다. 데이터 사이언티스트의 시장가치 즉 몸값이 높아져야 한다. 유능하지만 희소한, 그래서 높은 가격을 받는 인력들이 늘어나면 그와 유사한 공급들은 자연적으로 늘어날 것으로 기대된다.

 

이 지점에서 분명 왜 데이터 사이언티스트를 요구하는가에 대한 본질적인 부분에 대한 조직들의 냉철한 고찰이 필요하다. 과연 데이터 사이언티스트가 없어서 좋은 분석과 비즈니스 가치 창출이 이루어지지 못했던 것인지 아니면 그런 것들이 가능할 수 없는 조직의 분위기와 문화가 가로막고 있기 때문에 문제가 발생되고 있는 것인지를 짚어봐야 한다. 선후가 바뀐다면 결국 변화는 없을 것이기 때문이다.

 

[관련 강의 동영상: 데이터 사이언티스트의 특성과 역할 2013년 11월]

 

 

 

 

수요와 공급을 조절하는 정부의 적극적 개입이 필요하다

 

막연히 데이터 사이언티스트를 육성하면 일자리가 늘어난다는 식의 탁상행정적인 발상에서는 떠나야 한다. 정부가 분위기를 조성할 수 있는 영향력은 결코 무시할 수 없다. 다양한 지원프로그램을 통해 교육도 지원하고, 벤쳐도 양성하고, 공공부문의 사업을 통해 전문기업의 경험과 역량을 키워주는 것도 가능하다. 정부의 역할과 책임은 분명 매우 크다. 그 때문에 빅 데이터와 데이터 사이언스에 대한 관심을 사장시키지 않기 위해서 매우 적극적인 정부 차원의 개입을 요구해야한다는 생각이다. 다만 그 적극적인 개입이라는 부분이 생산적이고 효율적으로 집행되어야 한다고 본다. 책임감 없이 정부의 지원만 받고자 하는 기업들을 위한 개입이 되거나, 좀 더 큰 가치를 만들어 낼 수 있는 사업을 선정하지 못하고 무난한 사업들에 집중된다면 효과는 크게 줄어들 것이기 때문이다.

데이터 사이언티스트에 대한 수요와 공급조절에 대해서도 정보가 관여할 수 있는 부분이 상당히 존재한다. 데이터 사이언티스트의 양성을 위한 교육프로그램 지원과 주 공급원인 학교에 대한 지원, 실제 데이터 사이언티스트의 실무 역량을 배양할 수 있는 공공사업의 확대 등과 관련해서도 정부 차원에서 움직일 수 있는 여지는 많다. 수요처인 공공기관과 양성을 위한 학교와 교육프로그램이라는 강력하고 다양한 수단을 개별 기업보다는 정보가 가지고 있기 때문이다.

다만 정부가 이 과정에서 잊지 말아야 할 것은 수급에 대한 조절이다. 정권내의 기간에 걸친 빠른 성과를 목표로 한다면 이 백년대계를 봐야 하는 사업에서는 오히려 악영향도 있을 수 있다. 앞서 지적했던 것 처럼 이 분야에 매진한 사람들 즉 비교적 엘리트인 국민들의 미래까지를 염두에 두고 그들이 안정적인 숫자로 확보되고 지속적으로 자신의 역량을 발휘할 수 있도록 시장의 규모와 활성도를 관리해주려는 생각까지가 있어야 한다는 것이다.

 

 

정부의 역할만을 기대하는 것은 무책임하다.

 

정부가 해주어야 하는 역할이 매우 크다는 점을 지적했지만 그렇다고 해도 결국 가장 큰 수혜자는 기업이 되어야 한다. 전체 국민의 공공적인 이익을 위한 사업들은 그 자체로 가치가 있지만 기업이라면 내수든 수출이든 생산과 판매를 통해 빅 데이터를 분석한 결과로부터 가치를 얻어야 하는 것이다. 글로벌한 경쟁에서 생존해야 하는 기업의 임무는 내수에서의 경쟁력 뿐 아니라 더 많은 국내생산을 이끌어 내고 그 결과를 기업 자신의 이익으로 향유하는 것이다. 국내에는 전문인력이 없기 때문에 빅 데이터를 과학적으로 분석하는 것이 불가능하다는 생각에서 스스로도 일부 투자해서 전문 인력을 양성하고 그 인력들의 역량을 기업의 역량으로 활용해 더 큰 이익을 만들고 결과적으로는 국가전체의 국내생산을 늘려가는 선순환에 동참해야 한다. 자본주의 사회에서의 기업의 의무인 동시에 책임일 것이다. 물론 부수적으로는 직간접 고용창출이라는 측면에서 사회적인 책임을 하는 것이기도 할 것이지만.

 

-       -