차세대 저장장치 떠오른 DNA
AI 기술이 발전하고 디지털 시대로 접어들며 전 세계 데이터양은 폭발적으로 증가하고 있다. 2000년대 초반부터 2021년까지 생산된 데이터 총량이 약 50ZB(제타바이트, 10의21승 바이트)인데, 2023년 한 해에만 120ZB의 데이터가 생성됐다. 이는 1TB(테라바이트) 크기의 외장 하드디스크가 1200억 개 필요한 양이다. 이렇게 기존 저장장치로는 감당하기 어려울 정도로 데이터 생산 속도가 가속화되자, 과학자들은 작고 빠르고, 안정적인 차세대 저장장치를 개발하고 있다. 그중에서도 생명체의 설계도인 DNA를 활용한 저장장치가 새롭게 주목받고 있다.
미국 애리조나주립대 연구팀이 개발한 DNA 정보 저장 기술(왼쪽)과 이 기술로 저장 후 다시 출력한 판다 이미지(오른쪽). /ⓒNature
미국 애리조나주립대 연구팀이 개발한 DNA 정보 저장 기술(왼쪽)과 이 기술로 저장 후 다시 출력한 판다 이미지(오른쪽). /ⓒNature
현재 우리는 하드디스크드라이브(HDD), 솔리드스테이트드라이브(SSD)를 저장장치로 사용하며, GB(기가바이트)에서 TB 단위의 데이터를 저장한다. HDD는 자기 디스크가 회전하면서 물리적으로 데이터가 기록되고 읽히는 방식이다. SSD는 플래시 메모리라는 반도체에 데이터를 저장하는 장치다. 이들은 0과 1의 두 가지 숫자를 사용하는 이진법으로 데이터를 저장한다.

이진법은 단순해 오류 발생 가능성이 적고, 효율적이라는 장점이 있지만 동시에 수많은 정보를 단 2개의 숫자로 표기해야 하므로 그만큼 저장 공간이 많이 필요하다. 또 HDD와 SSD의 수명은 10년 내외로 길지 않아 주기적으로 데이터를 옮겨야 하는 번거로움이 있다.

이런 상황에서 DNA가 차세대 저장장치로 떠오르고 있다. 생체 분자인 DNA가 디지털 정보의 저장 매체로 활용된다는 점이 낯설게 느껴질 수도 있을 것이다. 하지만 DNA는 자연이 발명한 최고의 저장장치다. 생명체는 DNA를 이용해 정보를 저장하기 때문이다. 생명체의 정보는 아데닌, 시토신, 구아닌, 티민(A, G, C, T)이라는 4개의 염기배열로 이뤄져 있다.

DNA 저장장치의 가장 큰 장점은 작은 공간에 많은 데이터를 저장할 수 있다는 것이다. 현재 반도체 회로 사이의 간격은 2nm(나노미터, 1nm=10억분의 1미터)인데, DNA 염기 사이의 간격은 이보다 훨씬 작은 0.34nm다. 그 어떤 반도체보다 정보를 훨씬 더 촘촘하게 저장할 수 있어 데이터 저장 밀도가 기존 저장장치와는 비교할 수 없을 정도로 크다. 이론상 DNA 1g에는 최대 215PB(페타바이트, 10의15승 바이트)의 데이터를 저장할 수 있다.

또 DNA는 매우 안정적인 물질이기 때문에 상온에 보관도 쉽고, 수명도 길다. 고고학자들은 수십만, 수백만 년 전 화석에서 고대 DNA를 검출해 연구하고 있을 정도다.

그렇다면 DNA에 어떻게 데이터를 저장할 수 있을까? 0과 1로 된 디지털 정보를 각 염기로 변환한다. 예를 들어 A는 00, C는 01, G는 10, T는 11 등으로 정하고 이 규칙에 따라 정보를 염기서열로 바꾸는 것이다. 그리고 이 염기서열에 따라 DNA를 합성한다. 정보를 다시 읽어낼 때는 DNA 염기서열을 읽어내 규칙에 따라 디지털 정보로 바꾼다.

2012년 미국 하버드대 연구팀이 처음으로 5.27MB(메가바이트)의 데이터를 DNA에 저장하는 데 성공했다. 2023년 12월에는 프랑스의 바이오메모리라는 기업이 1KB(킬로바이트)의 데이터를 저장할 수 있는 DNA 칩을 출시했다. 매우 작은 용량이지만, 최초의 DNA 저장장치라는 측면에서 의미가 컸다.

최근에는 미국 애리조나주립대 연구팀이 DNA 합성 과정 없이 DNA에 정보를 저장하는 방법을 개발함으로써 DNA 정보 저장 속도를 획기적으로 높였다. 연구팀은 DNA 염기에 ‘메틸기’라는 화학 작용기를 붙여 염기에 메틸이 있으면 1, 없으면 0으로 구분하는 방법을 개발했다. 이 방법을 사용하면 화학반응 한 번에 350비트의 정보를 저장할 수 있다. 연구팀은 이 방식으로 700개의 DNA를 연결해 약 27만 5000비트, 약 34.4KB 용량의 DNA 저장장치를 만들었다. 이 장치로 판다 이미지를 저장한 후, 다시 출력하는 데 성공했다.

물론 DNA 저장장치가 당장 HDD와 SSD를 대체하기는 어렵다. 저장과 보관, 복구 방식이 번거롭고 비용도 매우 많이 들기 때문이다. 1KB의 데이터를 DNA로 만드는 데만 약 8시간이 걸린다. 게다가 합성 과정에서 오류가 생길 수도 있고, 정보를 수시로 저장하고 불러오거나 원하는 정보만 골라 찾기도 어렵다. 다만 과학자들은 문화적으로 중요한 데이터나 법률 문서, 중요한 정부 정보 등 장기간 사용하지 않는 데이터를 안전하게 보관하기를 원하는 사람들에게는 DNA 저장장치가 유용할 것으로 보고 있다.√ 기억해주세요
[과학과 놀자] 염기서열로 정보 기록…바이오메모리 시대 왔다
DNA에 어떻게 데이터를 저장할 수 있을까? 0과 1로 된 디지털 정보를 각 염기로 변환한다. 예를 들어 A는 00, C는 01, G는 10, T는 11 등으로 정하고 이 규칙에 따라 정보를 염기서열로 바꾸는 것이다. 그리고 이 염기서열에 따라 DNA를 합성한다. 정보를 다시 읽어낼 때는 DNA 염기서열을 읽어내 규칙에 따라 디지털 정보로 바꾼다.

오혜진 과학칼럼니스트·前 동아사이언스 기자