(10) 데이터의 중요성
[4차 산업혁명 이야기] 빅데이터가 다양한 가치를 창출하는 원천
데이터의 실시간 분석을 통한 맞춤형 전략 수립

독일은 브라질을 무려 7-1의 점수로 물리치고 결승에 진출했다. 경기가 끝난 뒤 독일 선수들은 비디오 게임을 하는 느낌을 받았다고 인터뷰했다. 브라질 선수들이 자신들이 예상하는 대로 움직였다는 것이다. 브라질 선수들의 움직임과 전략을 완전히 분석한 결과였다. 당시 독일축구연맹은 월드컵을 앞두고 자국 정보기술(IT) 기업인 SAP과 협력해 ‘매치인사이드’라는 소프트웨어를 개발했다. 훈련 중인 선수의 무릎과 어깨에 총 4개의 센서를 부착해 선수의 운동량, 순간속도, 심박 수, 슈팅 동작, 방향에 관한 데이터를 수집한다. 이렇게 수집된 데이터는 매치인사이드를 통해 실시간으로 분석된 뒤 경기장 밖 감독의 태블릿PC에 전달돼 선수의 컨디션 파악과 전술 변경에 활용된다. 한편 센서 한 개가 수집하는 데이터는 1분에 총 1만2000여 개다. 90분 동안 선수당 약 432만 개, 11명의 선수가 뛰므로 경기당 약 4968만 개의 데이터가 생성된다. 이렇게 쌓인 데이터는 개인의 장단점에 대한 피드백을 제공해 맞춤형 전술을 완성한다. 특히 남아공월드컵 당시 3.3초였던 선수당 볼 소유시간을 1.1초로 크게 단축해 공격적인 전술의 토대를 만들 수 있었다.
[4차 산업혁명 이야기] 빅데이터가 다양한 가치를 창출하는 원천
빅데이터를 활용한 새로운 부가가치의 창출

김동영 
KDI 전문연구원 
kimdy@kdi.re.kr
김동영 KDI 전문연구원 kimdy@kdi.re.kr
독일 축구 대표팀과 같이 데이터를 활용해 새로운 가치를 창출하는 사례를 많이 살펴볼 수 있다. 대표적인 사례는 온라인 유통 공룡인 아마존의 예측배송 시스템이다. 유통기업은 많은 양의 물품을 빠른 시간 안에 배송할 때 더 많은 가치를 창출할 수 있다. 고객들이 원하는 물품을 미리 알 수만 있다면 구매하기 전에 예측해 배송하는 일이 가능해진다. 이를 위해서는 고객의 구매 물품 리스트 및 구매 주기에 대한 정보가 필요한데, 아마존 웹페이지와 함께 인공지능 스피커인 에코는 집안 깊숙한 곳에서 고객의 이런 데이터를 수집하는 역할을 한다. 아마존은 이렇게 수집한 데이터를 바탕으로 예측배송 시스템을 구축 및 시행 중이다.

새롭게 창출된 부가가치의 이면에는 오늘날 ‘빅데이터(big data)’라고 부르는 광대한 데이터가 존재한다. 빅데이터는 용어 그대로 해석하면 단지 많은 양의 데이터만을 의미하는 듯하다. 하지만 ‘빅(big)’은 정보의 양보다는 다양성에 초점을 맞추고 있다. 기존에는 정형데이터만이 데이터로 인정됐지만 빅데이터에는 반정형 및 비정형 데이터도 포함되기 때문이다. 정형데이터는 일반적인 숫자 형식의 데이터를 의미한다. 스마트폰 데이터 사용량, 학점, 판매량 등이다. 모두 일정한 형태가 존재하고 분석이 가능하다. 반면 비정형 데이터는 텍스트나 이미지, 동영상 등과 같이 구조화되지 않은 형태의 데이터를 의미한다. 소셜네트워크서비스(SNS)에 올린 오늘의 기분, 친구에게 보낸 동영상 생일축하 메시지, 카카오톡 대화, 블로그에 올린 상품평 등이다. 일관된 형태도 없고 연산이 불가능해 기존에는 데이터의 범주에 포함되지 않았지만, 빅데이터 분석이 가능해진 요즘 새로운 부가가치는 비정형데이터 분석을 통해 창출돼 정형데이터보다 가치 있는 데이터로 인정받는다.

4차 산업혁명과 데이터

IT분야 컨설팅 기업 가트너는 빅데이터의 특징을 방대한 데이터 양(volume), 데이터 생성속도(velocity), 다양한 형태(variety)로 요약했다. 즉 빠른 속도로 유입되는, 엄청난 규모의, 다양한 데이터라는 의미다. 글로벌 기업을 중심으로 빅데이터 속에서 인사이트를 추출해 기업 가치를 증대시키려는 노력은 그 어느 때보다 활발해지고 있다. 구매패턴을 예측하고, 맞춤형 상품을 제공하여 기업경쟁력을 높이며, 최고경영자(CEO)의 직관에 의존했던 주요 의사결정이 빅데이터의 도움으로 객관적 의사결정이 가능해진 점 등이 대표적인 예다. 4차 산업혁명의 파괴적 혁신을 주도하는 인공지능 역시 빅데이터 없이는 존재하기 어렵다.

문제는 좋은 데이터다. 과거의 정형화된 데이터의 분석이든, 현재의 빅데이터 분석이든 모두 데이터 속에 숨은 일관된 패턴을 찾는 과정이다. 양질의 데이터가 존재하지 않으면 아무리 좋은 분석 도구가 있어도 무용지물이다. 알파고가 이세돌 9단을 이길 수 있었던 이유도 오랜 기간 축적돼 온 기보(棋譜) 덕분이었다. 나이팅게일이 사망률을 현저히 떨어뜨릴 수 있었던 이유도 세계 최초로 의무기록표를 만들어 문제의 상황을 분석할 수 있는 데이터를 구축했기 때문이다. 빅데이터를 분석할 수 있는 소프트웨어의 발전과 이를 수행할 고급 인력의 양성은 무엇보다 중요하다. 동시에 데이터의 중요성을 인식하고 구축할 수 있어야 한다. 브라질 월드컵 당시 독일축구대표팀의 빅데이터 전략에서 주목받았던 다른 요인은 데이터를 실시간으로 분석하는 소프트웨어 툴인 ‘HANA 플랫폼’이었다. 이 플랫폼을 개발해 SAP에 매각한 연구진이 서울대였다는 점은 시사하는 바가 크다. 데이터의 가치를 알아보는 기업과 국가가 4차 산업혁명의 과실을 얻을 수 있을 것이다.)

김동영 < KDI 전문연구원 kimdy@kdi.re.kr >