(12) 빅데이터와 데이터 과학자

데이터 과학자는 학문적 지식 외에
다양한 현장경험이 필수 요건
미국에선 10년 이상 현업경력 있어야
[4차 산업혁명 이야기] 빅데이터 시대되면서 '데이터 과학자'가 부상하고 있죠
2001년 9·11 테러 발생 직후 미국 연 방수사국(FBI)은 19명의 용의자 가 운데 11명의 이름을 발표했다. 테 러 발생 이후 단 3일 만이었다. 신속 한 대처의 이면에는 세계 최대 데이 터 판매업체 액시엄의 분석이 있었 다. 이들은 자사가 보유한 항공회사 의 티케팅 데이터와 미국 전역의 주 소 데이터 그리고 우체국이 제공하 는 주민들의 이사 데이터의 결합으 로 항공 티켓 구매자의 동선을 파악 할 수 있었고, 이를 바탕으로 용의 자를 선별해낼 수 있었다.

빅데이터와 데이터 과학자

김동영 
KDI 전문연구원 
kimdy@kdi.re.kr
김동영 KDI 전문연구원 kimdy@kdi.re.kr
액시엄은 미국인 3억 명을 비롯해 세계 7억 명의 개인정보를 수집하고 분류한 뒤 각 기업에 판매하는 세계 최대 데이터 판매업체다. 저장된 개인당 수집된 항목이 1500개에 이를 만큼 방대한 데이터를 보유하고 있다. 포천 100대 기업 전부는 물론이거니와 연방 정부 등 개인정보를 필요로 하는 모든 주체가 이들의 고객이다. 그리고 이들 사업의 중심에는 ‘데이터 과학자’가 자리하고 있다.

데이터 과학자가 빅데이터와 함께 주목을 받은 것은 사실이지만, 데이터를 다루는 직업군은 아주 오래전부터 다양한 분야에서 존재해왔다. 글로벌 구인·구직 네트워크 서비스인 링크트인에서 데이터 분석과 관련 있는 직업 타이틀을 검색하면 약 4900개의 직책이 등장할 만큼 쉽게 찾아볼 수 있는 직업군이기도 하다. 그럼에도 불구하고 데이터 과학자가 ‘21세기 가장 섹시한 직업(Data Scientist: The Sexiest Job of the 21st Century, Harvard Business Review)’으으로 여겨질 만큼 재조명되는 것은 기존 데이터 관련 직업군과는 차별화된 뭔가가 존재하기 때문이다.

데이터 분석가와 데이터 과학자

데이터 과학자가 기존의 데이터 관련 직업군과 차별화되는 점은 데이터 분석 자체에 그치지 않고 기업에 적용 가능한 전략적 인사이트를 제공한다는 것이다. 데이터 분석을 통해 얻은 종합적인 관점을 가지고 예측 및 최적화 등 전략적 의사 결정을 지원하는 것이다.

무엇보다 데이터 과학자는 커뮤니케이션 스킬을 갖춘 자들이라는 점에서 기존 데이터 분석가와 차별화된다. 기존 데이터 분석가들이 데이터 고유의 특성을 분석하고 가공하는 데 그쳤다면 데이터 과학자들은 분석을 통해 발견한 인사이트를 최고경영자가 이해하고 받아들일 수 있도록 설득할 수 있는 역량을 갖춘 자들이다. 분석의 결과로 얻어낸 인사이트가 그 자체에 머물지 않고 현업에 적용돼 실질적인 성과로 연결될 때 비로소 분석의 의미를 찾는 자들인 것이다. 2014년 미국 라바스톰애널리틱스사에서 데이터 과학자를 대상으로 한 설문조사에서 가장 어려움을 겪는 분야로 ‘인사이트에 대한 신뢰를 얻는 것’이 꼽힌 점은 이들이 실질적인 성과를 얼마나 중요시하는지 확인할 수 있는 대목이다.

데이터 과학자가 갖춰야 할 소양

이처럼 데이터 과학자의 역할은 데이터 분석에만 한정되지 않기 때문에 데이터 분석을 위한 소양만으로는 데이터 과학자라고 불릴 수 없다. 물론 데이터 분석을 위한 수학, 기초통계, 컴퓨터 과학, 모델링 기법 등 학문적 지식은 매우 중요하다. 2017년 구글에 인수된 온라인 플랫폼 캐글의 사용자 상위 100명을 분석한 결과 박사 학위 소지자가 35%, 석사 학위 소지자가 40% 이상이라는 결과는 이를 뒷받침한다. 캐글은 약 60만 명의 데이터 전문가가 모인 커뮤니티로, 기업 및 단체에서 풀리지 않는 해결과제를 데이터와 함께 등록하면 캐글 사용자들이 이를 해결하는 모델을 개발하고 경쟁하는 혁신 플랫폼이다.

데이터 과학자에게 무엇보다 필요한 소양은 현장 경험이다. 데이터 분석가에서 데이터 과학자로 발전하기 위해서는 분석 결과를 실제 비즈니스 문제와 결합해 해석할 수 있는 능력이 필수적이다. 인사이트란 분석 결과 자체가 아니라 현장 경험과의 결합으로 도출되기 때문이다. 이런 이유로 빅데이터 분석이 다양한 분야에서 활용되는 미국에서도 10년 이상 현업 경력이 있는 전문가들에게 비로소 데이터 과학자 칭호가 따라붙는다. 해마다 늘어나는 데이터 과학자 수요를 공급이 따라가지 못하는 이유가 여기에 있다. 데이터 과학자 수요가 빠르게 증가하는 이유는 빅데이터 분석이 우리가 모르고 있는지도 모르는 영역에서 인사이트를 찾아내기 때문이다. 데이터 과학자는 단기간의 교육만으로, 특정 지식의 습득만으로 양성되기 어렵다. 시장에서 요구하는 만큼의 데이터 과학자 수요를 따라잡는 유일한 방법은 장기적인 호흡이 바탕이 된 투자임을 잊지 말아야 할 것이다.

김동영 < KDI 전문연구원 kimdy@kdi.re.kr >