디지털 경제 읽기
(10) 데이터 공유
디지털 경제 핵심은 데이터
많을수록 더 강력한 AI 가질수 있어
데이터 공유가 기술발전 속도 가속
특정기업만 사용하면 독점화 폐단
(10) 데이터 공유
디지털 경제 핵심은 데이터
많을수록 더 강력한 AI 가질수 있어
데이터 공유가 기술발전 속도 가속
특정기업만 사용하면 독점화 폐단
![[디지털 이코노미] MS·SAP·어도비가 의기투합한 이유는](https://img.hankyung.com/photo/202106/AA.26517812.1.jpg)
더 큰 문제는 소수의 거대 정보기술(IT) 기업이 시장뿐 아니라 데이터를 독점하는 경우다. 데이터를 자신들만이 처리함으로써 경제의 다른 모든 부문이 이들 기업의 AI에 의존하도록 만드는 경우 엄청난 부의 이동이 발생할 수 있다. 브래드 스미스 마이크로소프트 사장은 자신의 책 《기술의 시대》를 통해 데이터를 독점하는 거대 IT기업이 중국의 동부해안과 미국의 서부해안에 몰려 있다면 이 두 지역이 이들을 보는 대가로 다른 모든 지역이 희생될 것이라고 설명한다. 공유를 통한 데이터 규모 문제 해결더 나은 AI를 위해서는 데이터의 양이 중요하다. 분명 규모가 크면 유리하다. 초기 시장에서 중국이 AI 분야를 리드할 수 있는 요인이다. 오늘날 중국 인구는 데이터를 생성할 수 있는 능력을 의미한다. 하지만 범위를 세계로 넓혀보면 중국이 차지하는 인구는 세계의 18%에 불과하다. 데이터를 연료로 삼는 AI와 끊임없이 재생산되는 데이터의 특성에 비춰봤을 때 자국이 생산하는 18% 데이터에만 초점을 맞출 수는 없다. 게다가 데이터는 경합성이 없다. 데이터는 디지털 경제시대의 석유와 같다고 이야기하지만, 석유와 달리 쓰고 또 쓸 수 있다. 똑같은 데이터지만 누가 쓰느냐에 따라 완전히 다른 인사이트를 찾아낼 수 있다. 여러 번 쓸수록 가치가 떨어지는 것이 아니라 새로운 인사이트를 발견하는 재료가 되어 오히려 가치가 늘어난다. 데이터가 핵심인 오늘날 데이터 공유의 필요성을 이해할 수 있는 대목이다.
프레드허친슨암연구센터는 AI를 활용한 암 진단기술을 개발하고 싶었지만 데이터가 턱없이 부족했다. 다른 암센터도 마찬가지다. 경쟁도 데이터가 있어야 가능하지만, 각 의료기관에 잠자고 있는 데이터만으로는 AI 개발이 턱없이 부족했다. 매슈 트러널 프레드허친슨암연구센터 최고데이터책임자는 데이터 공유가 의료기관 간 암 치료 경쟁을 가속화할 방법임을 깨달았다. 그의 아이디어에 공감해 마이크로소프트와 SAP, 어도비가 모여 ‘오픈데이터이니셔티브’를 형성했고, 다양한 기관이 데이터 소유권과 통제권을 유지하면서 데이터를 모아 공유할 수 있는 기술 플랫폼과 툴을 제공하기 위해 노력하고 있다. 마이크로소프트는 프레드허치슨암센터, 워싱턴대, 밴쿠버의 브리티시컬럼비아대 BC암센터가 프라이버시를 보호할 수 있는 방식으로 데이터를 공유하는 데 도움을 주고 있다. 데이터 공유와 성장소프트웨어의 개발도 공유를 시발점으로 진화하기 시작했다. 처음에 소프트웨어기업의 소스코드는 당연히 기밀이었다. 하지만 오픈소스가 등장하자 개발자들은 자신의 코드를 공개하기 시작했다. 이런 문화 덕분에 공개된 코드에 살을 붙여 큰 힘을 들이지 않고 더 나은 코드를 개발할 수 있었다. 개발자들 사이에 폭넓은 협업이 가능해진 것이다.
데이터가 중심인 디지털 경제시대에 ‘공유’는 결코 호혜적 개념이 아니다. 석유처럼 어느 일방이 독점할 수 없는 데이터를 최대한으로 활용하기 위한 구체적인 방안이다. 물론 개인정보 보호를 위한 구체적 합의와 보안 기술을 갖추는 것은 필수로 전제되어야 한다. 법과 정책 역시 뒷받침되어야 한다. 많은 기준이 대부분 AI가 본격화되기 전에 제정되었다. ‘목적 제한’에 초점을 맞춘 데이터 활용 규제가 대표적이다. 현재는 데이터 수집 당시 구체적으로 명시한 목적을 위해서만 사용하도록 규정되어 있다. 하지만 데이터 공유를 통해 예상하지 못했지만 사회적으로 바람직한 인사이트를 얻을 많은 기회를 가질 수 있다.
