효용은 쓰임에서 나온다. 쓰임이 없으면 모든 게 무용지물이다. 빅데이터는 그 쓰임새가 무한팽창 중이다. 인공지능·로보어드바이저·사물인터넷·모바일·3D프린터…. 빅데이터는 ICT(정보통신기술) 시대의 주춧돌이다. 데이터가 허약하면 어느 것 하나 제대로 기능을 하지 못한다. 빅데이터는 ‘기계의 두뇌’다. 21세기는 데이터의 가치를 알고, 데이터를 잘 활용하는 개인·기업·국가가 앞서간다.
자동차보험료를 좌우하다
파이낸셜타임스(FT)가 얼마 전 빅데이터가 적용된 구체적 사례 하나를 소개했다. 영국 남부에 사는 27세 여성 데니스 스미스는 2014년 말 소형차를 중형차로 바꿨다. 한데 보험료는 연 700파운드에서 300파운드로 되레 줄었다. 보험료를 절반 이하로 낮춰준 건 글로벌 보험사 아비바의 앱(응용프로그램)이다. 스미스는 새 차 구입 직전에 아비바 앱을 내려받았다. 아비바는 앱을 통해 과속·신호위반·끼어들기 등 운전 행태를 낱낱이 분석했고, 그를 ‘우량고객’으로 판단해 보험료를 파격적으로 깎아줬다. 실제로 2014년 유럽에선 456만건의 보험계약이 고객의 빅데이터 정보제공을 전제로 이뤄졌다. 2012년 190만건에서 불과 2년 만에 두 배 이상으로 급증했다.
항공권 구매시점을 예측하다
마이크로소프트(MS) 검색엔진 빙(Bing)의 ‘페어캐스트(Farecast)’는 항공권을 가장 싸게 사는 시점을 알려준다. 여행 웹사이트에서 모은 가격 표본 1만2000여개를 이용해 만든 이 예측모델은 정확도가 75% 안팎이다. 2012년 페어캐스트가 짚어준 시점에 항공권을 구매한 여행자는 장당 평균 50달러를 아꼈다. 데이터가 누적될수록 정확도는 높아지고 여행자들은 더 싸게 항공권을 살 것이다. 비행기 엔진을 만드는 영국의 롤스로이스는 자사 제품에서 얻은 방대한 데이터를 분석해 고장이 나기 전에 미리 엔진을 교체해준다. 구글은 독감과 관련된 검색어 빈도를 분석해 독감 환자 수와 유행지역을 예측하는 프로그램도 개발했다. 미국 국세청은 빅데이터로 납세자의 탈세 징후까지 포착한다.
선거 전략을 짜주다
2012년 재선에 성공한 오바마는 대선 2년 전부터 빅데이터팀을 가동했다. 6만6000번의 모의선거로 데이터를 모으고, 이를 분석해 전략을 짰다. 반면 공화당의 밋 롬니 측은 선거 7개월을 앞두고서야 빅데이터 의미를 깨달았다. 데이터는 비대칭적으로 누적된다. 데이터는 ‘눈덩이 효과’가 아주 크다. 미리 굴리느냐, 나중에 굴리느냐가 덩치를 결정적으로 좌우한다. 그런 점에서 오바마와 롬니의 승부는 투표 전에 이미 갈렸다. 빅데이터 시대에는 패스트팔로어(fast follower)의 퍼스트무버(first mover) 추격이 갈수록 더 버거워진다. 데이터들이 서로 융합하고, 기계들이 스스로 학습하면서 데이터 강자와 약자의 간극을 무섭게 벌려 놓는다.
신용카드가 똘똘해지다
‘빅데이터가 만드는 세상’의 저자이기도 한 쇤베르거는 빅데이터를 ‘안경’에 비유한다. 안경을 써도 없는 건 보이지 않는다. 다만 있는 게 더 선명해진다. 망원경·현미경·내시경도 이치는 같다. 빅데이터는 어리어리하고 희미한 곳에 ‘숨어 있는 것들’을 찾아내고, 그 형상들의 과거·현재·미래 의미를 읽어준다. 빅데이터는 안경이자 나침반이다. 신용카드는 빅데이터 덕에 빠르게 똘똘해진다. 카드사들은 하루 수백·수천만 건에 달하는 카드 승인 내용을 분석해 ‘맞춤형 상품’을 내놓는다. 하루 두어 잔씩 커피를 마시던 30대 초반 여성이 갑자기 커피를 끊고 유기농 식품을 주문하면 임신 가능성이 높다고 판단, 메일이나 문자로 태교여행을 권한다. 미국의 디사이드닷컴(Decide.com)은 빅데이터로 각종 전자제품의 할인시점을 예측한다.
인공지능을 진화시키다
빅데이터는 ‘기계의 두뇌’다. 인공지능(AI)의 진화는 데이터가 그 속도를 좌우한다. 데이터를 품을수록 기계는 인간의 맞수로 변신한다. 프로 바둑 기사를 꺾은 구글 ‘알파고’는 어마어마한 빅데이터가 스승이다. 데이터는 기계의 두뇌를 자극한다. 데이터는 기계의 분석·판단·예측·통찰력을 키운다. 기계든 인간이든 데이터가 부실하면 오류가 잣다. 데이터는 직관보다 객관적이고, 그 쓰임은 무궁하다. “빅데이터는 연필과 같다. 누구에게나 필요하고 어디에서나 쓰인다.” 헥터 가르시아-몰리나 미국 스탠퍼드대 교수는 쉽고도 맛깔나게 빅데이터 의미를 설명한다. 그는 구글 공동창업자 래리 페이지와 세르게이 브린의 대학원 시절 지도교수다.
상관성으로 통찰을 주다
빅데이터 시대에는 ‘빅데이터적 사고’가 필요하다. 쇤베르거는 빅데이터 세상에선 인과성(causality)에서 상관성(correlation)으로 생각의 방점을 조금 옮기라고 강조한다. 인과(因果)에 지나치게 얽매이기보다 빅데이터가 보여주는 상관(相關)을 그대로 받아들이고, 거기에서 새로운 통찰을 얻고 방향성을 찾으라는 얘기다. 사실 그의 지적처럼 항공사의 항공권 가격정책을 일일이 몰라도 빅데이터가 정확히 구매 시점을 짚어준다면 그걸로 충분하다. 데이터가 방대할수록 방향성의 오류는 그만큼 줄어든다.
신동열 한국경제신문 연구위원 shins@hankyung.com
자동차보험료를 좌우하다
파이낸셜타임스(FT)가 얼마 전 빅데이터가 적용된 구체적 사례 하나를 소개했다. 영국 남부에 사는 27세 여성 데니스 스미스는 2014년 말 소형차를 중형차로 바꿨다. 한데 보험료는 연 700파운드에서 300파운드로 되레 줄었다. 보험료를 절반 이하로 낮춰준 건 글로벌 보험사 아비바의 앱(응용프로그램)이다. 스미스는 새 차 구입 직전에 아비바 앱을 내려받았다. 아비바는 앱을 통해 과속·신호위반·끼어들기 등 운전 행태를 낱낱이 분석했고, 그를 ‘우량고객’으로 판단해 보험료를 파격적으로 깎아줬다. 실제로 2014년 유럽에선 456만건의 보험계약이 고객의 빅데이터 정보제공을 전제로 이뤄졌다. 2012년 190만건에서 불과 2년 만에 두 배 이상으로 급증했다.
항공권 구매시점을 예측하다
마이크로소프트(MS) 검색엔진 빙(Bing)의 ‘페어캐스트(Farecast)’는 항공권을 가장 싸게 사는 시점을 알려준다. 여행 웹사이트에서 모은 가격 표본 1만2000여개를 이용해 만든 이 예측모델은 정확도가 75% 안팎이다. 2012년 페어캐스트가 짚어준 시점에 항공권을 구매한 여행자는 장당 평균 50달러를 아꼈다. 데이터가 누적될수록 정확도는 높아지고 여행자들은 더 싸게 항공권을 살 것이다. 비행기 엔진을 만드는 영국의 롤스로이스는 자사 제품에서 얻은 방대한 데이터를 분석해 고장이 나기 전에 미리 엔진을 교체해준다. 구글은 독감과 관련된 검색어 빈도를 분석해 독감 환자 수와 유행지역을 예측하는 프로그램도 개발했다. 미국 국세청은 빅데이터로 납세자의 탈세 징후까지 포착한다.
선거 전략을 짜주다
2012년 재선에 성공한 오바마는 대선 2년 전부터 빅데이터팀을 가동했다. 6만6000번의 모의선거로 데이터를 모으고, 이를 분석해 전략을 짰다. 반면 공화당의 밋 롬니 측은 선거 7개월을 앞두고서야 빅데이터 의미를 깨달았다. 데이터는 비대칭적으로 누적된다. 데이터는 ‘눈덩이 효과’가 아주 크다. 미리 굴리느냐, 나중에 굴리느냐가 덩치를 결정적으로 좌우한다. 그런 점에서 오바마와 롬니의 승부는 투표 전에 이미 갈렸다. 빅데이터 시대에는 패스트팔로어(fast follower)의 퍼스트무버(first mover) 추격이 갈수록 더 버거워진다. 데이터들이 서로 융합하고, 기계들이 스스로 학습하면서 데이터 강자와 약자의 간극을 무섭게 벌려 놓는다.
신용카드가 똘똘해지다
‘빅데이터가 만드는 세상’의 저자이기도 한 쇤베르거는 빅데이터를 ‘안경’에 비유한다. 안경을 써도 없는 건 보이지 않는다. 다만 있는 게 더 선명해진다. 망원경·현미경·내시경도 이치는 같다. 빅데이터는 어리어리하고 희미한 곳에 ‘숨어 있는 것들’을 찾아내고, 그 형상들의 과거·현재·미래 의미를 읽어준다. 빅데이터는 안경이자 나침반이다. 신용카드는 빅데이터 덕에 빠르게 똘똘해진다. 카드사들은 하루 수백·수천만 건에 달하는 카드 승인 내용을 분석해 ‘맞춤형 상품’을 내놓는다. 하루 두어 잔씩 커피를 마시던 30대 초반 여성이 갑자기 커피를 끊고 유기농 식품을 주문하면 임신 가능성이 높다고 판단, 메일이나 문자로 태교여행을 권한다. 미국의 디사이드닷컴(Decide.com)은 빅데이터로 각종 전자제품의 할인시점을 예측한다.
인공지능을 진화시키다
빅데이터는 ‘기계의 두뇌’다. 인공지능(AI)의 진화는 데이터가 그 속도를 좌우한다. 데이터를 품을수록 기계는 인간의 맞수로 변신한다. 프로 바둑 기사를 꺾은 구글 ‘알파고’는 어마어마한 빅데이터가 스승이다. 데이터는 기계의 두뇌를 자극한다. 데이터는 기계의 분석·판단·예측·통찰력을 키운다. 기계든 인간이든 데이터가 부실하면 오류가 잣다. 데이터는 직관보다 객관적이고, 그 쓰임은 무궁하다. “빅데이터는 연필과 같다. 누구에게나 필요하고 어디에서나 쓰인다.” 헥터 가르시아-몰리나 미국 스탠퍼드대 교수는 쉽고도 맛깔나게 빅데이터 의미를 설명한다. 그는 구글 공동창업자 래리 페이지와 세르게이 브린의 대학원 시절 지도교수다.
상관성으로 통찰을 주다
빅데이터 시대에는 ‘빅데이터적 사고’가 필요하다. 쇤베르거는 빅데이터 세상에선 인과성(causality)에서 상관성(correlation)으로 생각의 방점을 조금 옮기라고 강조한다. 인과(因果)에 지나치게 얽매이기보다 빅데이터가 보여주는 상관(相關)을 그대로 받아들이고, 거기에서 새로운 통찰을 얻고 방향성을 찾으라는 얘기다. 사실 그의 지적처럼 항공사의 항공권 가격정책을 일일이 몰라도 빅데이터가 정확히 구매 시점을 짚어준다면 그걸로 충분하다. 데이터가 방대할수록 방향성의 오류는 그만큼 줄어든다.
신동열 한국경제신문 연구위원 shins@hankyung.com