(13) 개인정보의 보호와 활용

데이터는 대부분 개인정보에서 창출
개인정보는 보호되고 활용되는 자원
신뢰 통해 보호와 활용 균형 찾아야
[4차 산업혁명 이야기] 빅데이터 시대, 개인정보는 보호와 활용의 균형이 중요해요
페이스북 가입자 5000만 명의 정보 가 동의 없이 제3자에게 전달되었 다. 해당 정보가 45대 미국 대통령 선거에서 도널드 트럼프 공화당 후 보를 위해 활용된 것이 알려지자 페 이스북은 창사 이래 최대의 위기를 맞았다. 주가가 7% 가까이 폭락하 는가 하면, 최고경영자(CEO)인 마 크 저커버그는 미국, 영국, 유럽연 합(EU) 의회로부터 소환되었다. 구 글과 아마존, 트위터와 같은 정보기 술(IT) 기반 기업들 역시 이번 사태 에 귀추를 주목하고 있다. 이번 사 건의 여파가 어디로 번질지 모르기 때문이다.

개인정보는 보호되고 개인에게 귀속돼야

김동영 
KDI 전문연구원 
kimdy@kdi.re.kr
김동영 KDI 전문연구원 kimdy@kdi.re.kr
사실 개인정보 유출 문제는 빅데이터의 발전과 함께 끊임없이 제기되는 우려였다. 빅데이터가 4차 산업혁명 시대 원유라 불리는 이유 중 하나는 개인정보의 분석을 통해 평균적 접근이 아닌 개개인에게 최적화된 솔루션을 찾아낼 수 있기 때문이다. 문제는 개인정보는 본질적으로 보호되고, 개인에게 귀속되어야 한다는 점이다. 이런 특성의 정보가 활용될 때 새로운 가치가 창출되는 역설적인 상황이 개인정보의 보호와 활용 사이에 균형을 유지하기 어렵게 만드는 요인이다.

개인정보를 둘러싼 공통의 문제들

개인정보의 보호와 활용의 딜레마를 해결할 보편적인 제도적 해결책은 사실상 존재하지 않는다. 국가마다 보유한 자원이 상이하고, 처한 제약이 다르기 때문이다. 다만 개인정보를 둘러싼 공통된 주요 이슈들은 존재하는데, ‘동의’와 ‘비식별화’의 문제이다.

동의의 문제는 개인정보가 포함된 빅데이터 구축과 활용의 기초가 된다. 동의와 관련하여 Opt-in과 Opt-out의 두 가지 방식이 존재한다. Opt-in은 개인정보 제공자의 사전 동의가 있어야 개인정보 수집과 활용이 가능한 방식이며, Opt-out은 모든 사람이 동의했다는 전제하에 수집과 활용이 이뤄지고, 수집에 동의하지 않는 사람이 명시적인 거부의사를 표할 경우에 한해 수집을 중단하는 방식이다. 개인정보의 보호에 초점을 맞출 경우 Opt-in 방식을, 활용이 보다 강조되어야 하는 분야에서는 Opt-out 방식을 취하는 것이 일반적이다. 하지만 국가마다 동의 방식이 상이하고, 한 국가 내에서도 분야에 따라 상이한 동의절차를 취하고 있다.

한편, 비식별화(de-identification)란 개인을 식별할 수 있는 요소를 가명처리하는 조치이다. 주민등록번호를 복잡한 숫자와 문자의 조합으로 구성된 새로운 구분자로 대체하는 작업이 이에 해당한다. 어느 정도의 비식별화가 필요한가의 문제는 빅데이터 활용에서 매우 중요하다. 빅데이터가 현장에서 분석되고 활용되기 위해서는 다른 데이터와의 결합이 필수적이기 때문이다. 진료 현장에서 쌓인 데이터만으로도 유의미한 정보를 찾아낼 수 있지만, 개인의 자산, 교육 수준, 거주지 등의 다른 개인정보와 결합될 때 이전에 없던 가치를 창출할 수 있다.

하지만 데이터 간 결합이 높은 효용성을 가져다준다는 이유만으로 누구나 알아볼 수 있는 형태로 개인정보를 주고받을 수는 없다. 개인정보란 개인을 식별할 수 있는 정보로 공유를 전제로 구축된 데이터가 아니기 때문이다. 문제는 비식별화 정도가 강할수록 다른 데이터와의 결합 가능성은 낮아진다는 점에 있다. 결합을 위해서는 공통의 기준이 필요한데, 비식별화 작업이 이뤄지고 나면 개인을 식별할 수 있는 공통의 기준이 사라져 결합이 어려워지기 때문이다.

개인정보 활용은 신뢰의 문제

개인정보를 둘러싼 문제는 많은 경우 제도적인 측면을 통해 해결하고자 노력하지만, 보호와 활용의 균형을 위해 반드시 필요한 요인은 ‘신뢰’이다. 구체적으로 개인정보 활용에 대한 신뢰란 개인정보 활용에 따른 사회적 편익(societal benefit)이 사회적 위험(societal risk)보다 크다는 것에 대한 믿음을 의미한다. 아무리 뛰어난 보호와 활용 제도가 존재하더라도 개인정보 활용에 대해 신뢰하지 못하면 개인정보는 본연의 특성상 보호에 치중될 수밖에 없다. 다른 어떤 분야보다 양질의 빅데이터가 구축된 의료 및 금융 분야에서 빅데이터 활용이 소극적인 핵심 원인은 사회적 편익과 위험 중 어느 것이 더 큰지에 대한 사회적 합의가 이뤄지지 않기 때문이다.

페이스북이 개인정보를 활용해 이윤을 추구한다는 것을 모르는 사람은 없었다. 페이스북은 무료 서비스를 바탕으로 수집한 개인정보를 맞춤형 광고서비스에 활용하는 광고회사이다. 2017년 405억원의 매출 가운데 98%가 광고매출이었다는 점이 이를 보여준다. 일찍이 애플의 CEO 팀 쿡은 “온라인 서비스가 무료라면, 사용자는 소비자가 아니라 상품인 것이다”라고 이야기 한 바 있다. 창립 14년 만에 가장 큰 위기를 맞은 페이스북 사건의 본질은 개인정보의 유출이 아니다. 개인정보를 활용한 페이스북의 서비스가 사회적 편익을 높인다고 믿었던 신뢰가 깨어진 점에 문제의 근본이 있다. 이전까지 보지 못했던 영역에서 새로운 가치를 창출해 줄 빅데이터의 활용이 어떤 지향점을 가지고 이뤄져야 하는지 엿볼 수 있는 대목이라 할 수 있다.

김동영 < KDI 전문연구원 kimdy@kdi.re.kr >