디지털 경제 읽기
(10) 데이터 공유

디지털 경제 핵심은 데이터
많을수록 더 강력한 AI 가질수 있어

데이터 공유가 기술발전 속도 가속
특정기업만 사용하면 독점화 폐단
[디지털 이코노미] MS·SAP·어도비가 의기투합한 이유는
"인공지능(AI) 세상의 질서는 중국과 미국의 몇 안 되는 기업 손에 유례없는 부가 집중되는 승자독식의 경제를 만들어낼 것이다. 나머지 국가들은 먹다 남은 찌꺼기나 줍게 될 것이다." 《AI슈퍼파워》 저자이자 마이크로소프트와 구글, 애플에서 임원을 지낸 리카이푸의 주장이다. 디지털 경제와 데이터 독점리카이푸 주장의 핵심은 데이터다. 데이터는 AI의 연료이기 때문에 가장 많은 데이터를 확보한 기업이 더 강력한 AI를 가질 수 있다는 것이다. 이는 더 많은 이용자를 끌어모으는 요인이 되고, 이에 따라 더 많은 데이터를 확보하게 될 것이다. 결국 규모의 경제로 이어져 시장의 모든 경쟁자를 압도할 수 있게 된다. AI 중심의 경제가 독점과 맞닿아 있는 이유다. 일단 초반에 주도권을 잡으면 다른 기업은 더 이상 진입할 수 없는 진입장벽이 형성된다.

더 큰 문제는 소수의 거대 정보기술(IT) 기업이 시장뿐 아니라 데이터를 독점하는 경우다. 데이터를 자신들만이 처리함으로써 경제의 다른 모든 부문이 이들 기업의 AI에 의존하도록 만드는 경우 엄청난 부의 이동이 발생할 수 있다. 브래드 스미스 마이크로소프트 사장은 자신의 책 《기술의 시대》를 통해 데이터를 독점하는 거대 IT기업이 중국의 동부해안과 미국의 서부해안에 몰려 있다면 이 두 지역이 이들을 보는 대가로 다른 모든 지역이 희생될 것이라고 설명한다. 공유를 통한 데이터 규모 문제 해결더 나은 AI를 위해서는 데이터의 양이 중요하다. 분명 규모가 크면 유리하다. 초기 시장에서 중국이 AI 분야를 리드할 수 있는 요인이다. 오늘날 중국 인구는 데이터를 생성할 수 있는 능력을 의미한다. 하지만 범위를 세계로 넓혀보면 중국이 차지하는 인구는 세계의 18%에 불과하다. 데이터를 연료로 삼는 AI와 끊임없이 재생산되는 데이터의 특성에 비춰봤을 때 자국이 생산하는 18% 데이터에만 초점을 맞출 수는 없다. 게다가 데이터는 경합성이 없다. 데이터는 디지털 경제시대의 석유와 같다고 이야기하지만, 석유와 달리 쓰고 또 쓸 수 있다. 똑같은 데이터지만 누가 쓰느냐에 따라 완전히 다른 인사이트를 찾아낼 수 있다. 여러 번 쓸수록 가치가 떨어지는 것이 아니라 새로운 인사이트를 발견하는 재료가 되어 오히려 가치가 늘어난다. 데이터가 핵심인 오늘날 데이터 공유의 필요성을 이해할 수 있는 대목이다.

프레드허친슨암연구센터는 AI를 활용한 암 진단기술을 개발하고 싶었지만 데이터가 턱없이 부족했다. 다른 암센터도 마찬가지다. 경쟁도 데이터가 있어야 가능하지만, 각 의료기관에 잠자고 있는 데이터만으로는 AI 개발이 턱없이 부족했다. 매슈 트러널 프레드허친슨암연구센터 최고데이터책임자는 데이터 공유가 의료기관 간 암 치료 경쟁을 가속화할 방법임을 깨달았다. 그의 아이디어에 공감해 마이크로소프트와 SAP, 어도비가 모여 ‘오픈데이터이니셔티브’를 형성했고, 다양한 기관이 데이터 소유권과 통제권을 유지하면서 데이터를 모아 공유할 수 있는 기술 플랫폼과 툴을 제공하기 위해 노력하고 있다. 마이크로소프트는 프레드허치슨암센터, 워싱턴대, 밴쿠버의 브리티시컬럼비아대 BC암센터가 프라이버시를 보호할 수 있는 방식으로 데이터를 공유하는 데 도움을 주고 있다. 데이터 공유와 성장소프트웨어의 개발도 공유를 시발점으로 진화하기 시작했다. 처음에 소프트웨어기업의 소스코드는 당연히 기밀이었다. 하지만 오픈소스가 등장하자 개발자들은 자신의 코드를 공개하기 시작했다. 이런 문화 덕분에 공개된 코드에 살을 붙여 큰 힘을 들이지 않고 더 나은 코드를 개발할 수 있었다. 개발자들 사이에 폭넓은 협업이 가능해진 것이다.

데이터가 중심인 디지털 경제시대에 ‘공유’는 결코 호혜적 개념이 아니다. 석유처럼 어느 일방이 독점할 수 없는 데이터를 최대한으로 활용하기 위한 구체적인 방안이다. 물론 개인정보 보호를 위한 구체적 합의와 보안 기술을 갖추는 것은 필수로 전제되어야 한다. 법과 정책 역시 뒷받침되어야 한다. 많은 기준이 대부분 AI가 본격화되기 전에 제정되었다. ‘목적 제한’에 초점을 맞춘 데이터 활용 규제가 대표적이다. 현재는 데이터 수집 당시 구체적으로 명시한 목적을 위해서만 사용하도록 규정되어 있다. 하지만 데이터 공유를 통해 예상하지 못했지만 사회적으로 바람직한 인사이트를 얻을 많은 기회를 가질 수 있다.

김동영
KDI 전문연구원
김동영 KDI 전문연구원
최근 플랫폼기업의 독점 이슈가 많은 분야에서 거론되고 있다. 오늘날 플랫폼기업의 독점력이 데이터에서 나오는 만큼, 데이터 공유에 관한 시각과 정부의 적극적인 지원이 디지털 경제시대의 경쟁과 성장을 달성할 수 있게 할 것이다.