#빅데이터
-
디지털 이코노미
'구글 독감 트렌드' 빅데이터 마법 같았지만…
‘데이터가 충분하면 스스로 말한다.’ 2008년 <와이어드(Wired)>에 실린 도발적인 기사다. 이는 데이터가 전체 모집단에 가까워진다면, 오랜 통계적 표본 추출 기법은 아무 쓸모가 없다는 주장이다. 과학적 모형도 필요없다는 주장마저 담겼다. 해당 결과가 맞는지 그렇지 않은지에 대한 이론을 개발할 이유도, 검증할 필요도 없다는 것이다.구글 엔지니어들은 ‘구글 독감 트렌드(Google Flu Trends)’를 만들면서 어떤 검색어가 독감 전파와 관련있는지에 대해 가설을 세우지 않았다. ‘김동영’보다 ‘독감 증상’ ‘근처 약국’ 같은 검색어가 독감 발생과 밀접하다는 상식적인 추론이 가능하지만 구글팀은 전혀 고려하지 않았다. 단지 상위 5000만 개의 검색어를 입력하고 알고리즘이 파악하도록 했다. 한때 구글의 독감 트렌드는 빅데이터와 알고리즘이 만들어 낸 새로운 세상의 상징이었다. 구글 독감 트렌드는 5000만 개의 검색어를 분석하는 패턴 인식 알고리즘이다. 이를 통해 추가 독감 발생 사례에 관한 질병통제예방센터 발표와 일치하는 검색어를 찾는다. 실제 여러 해 겨울에 독감 발생 현황을 안정적으로 알려줬지만 이들의 추정은 과장됐음이 입증됐다. 느리지만 꾸준히 업데이트되는 질병통제예방센터의 데이터는 이들 추정이 실제보다 두 배만큼 과장된 경우가 있음을 찾아냈다. 문제는 2009년에도 발생했다. 여름 독감이 발생하자 구글 독감 트렌드는 아무런 힘을 쓸 수 없었다. 겨울의 징후에만 반응하도록 설계된 탓이었다. 이번에는 실제 발병 사례가 구글의 추정보다 네 배나 높게 나왔다. 연구진은 구글 독감 트렌드를 특별한 이유 없이 폐기해버렸다. 빅데
-
과학과 놀자
나와 비슷한 성향의 사람들이 좋아한 콘텐츠, OTT 서비스 업체가 나에게도 추천해주죠
코로나 덕분에 급성장한 회사가 있다. 전 세계 OTT(Over-the-top) 시장을 선도하고 있는 넷플릭스다. 닐슨코리아가 발간한 ‘2020년 하반기 미디어 리포트’에 따르면 넷플릭스는 코로나 영향 속에서도 순이용자수가 64.2% 늘었다. 한국수출입은행 보고서 역시 넷플릭스뿐 아니라 왓챠, 웨이브, 티빙과 같은 국내 OTT 서비스도 2012년 이후 연평균 28%의 고속 성장을 거듭하고 있다고 밝혔다. 바야흐로 대OTT 시대다.OTT 서비스가 기존 TV 채널이나 VOD 서비스에 비해 사용자의 적극적인 가입 및 시청을 위해 활용하는 전략은 크게 두 가지다. 첫 번째는 해당 OTT 서비스를 가입해야만 시청할 수 있는 오리지널 콘텐츠다. K드라마의 인기를 이끈 ‘오징어게임’이 대표적인 사례다. 사람들은 오징어게임이나 킹덤 같은 유명 콘텐츠를 시청한 이후에도 넷플릭스에 머문다. 사용자의 시청 이력을 바탕으로 개인 취향에 맞는 영화와 드라마를 지속적으로 추천해 주기 때문이다. 이것이 바로 OTT 서비스의 차별화 전략 두 번째, 개인화다.개인화란 사용자의 과거 시청 이력으로부터 그 취향을 분석하고 이를 토대로 개별 사용자에게 맞춤화된 콘텐츠를 제공하는 것을 말한다. 초기 추천 서비스의 경우 사용자가 입력한 나이, 성별, 거주지와 같은 개인 정보에 따라 미리 준비해 둔 추천이 이뤄졌다. 이는 해당 범주에 속하는 대부분의 사용자에게 만족스러운 추천 결과를 제공해 줄 수는 있겠지만, 개인에 따라 서로 다른 결과를 제공해주는 개인화와는 다른 개념이다. 어도비 설문 조사에 따르면 콘텐츠가 개인화되지 않은 경우 소비자의 42%가 불만을 표출한다고 할 정도로 개인화 서비스는 필수적인 마케팅 전략이 됐다.
-
과학과 놀자
신약개발 과정에서 독성·안전성을 검증하기 위한 동물 대상 실험, 빅데이터 구축해 동물실험 최소화…인공장기로 대체도
우리는 살아가면서 몸이 아프면 병원이나 약국에 가서 증상에 맞는 약을 처방받는다. 이렇게 쉽게 접할 수 있는 약이 세상에 나오기까지는 많은 시간적 노력과 천문학적 금액의 비용이 투입된다. 신약의 파이프라인(개발 후보물질) 단계에서 비임상시험을 거쳐 임상시험을 통해 세상에 나오기까지 평균 10년 정도의 시간이 소요되며, 대략 하나의 신약이 성공하기까지 1조원 정도의 돈이 투자된다.많은 시간과 비용이 투자되는 만큼 신약 개발의 주요 단계에서 후보물질의 고-스톱(진행-중단) 여부를 결정짓기 위해 다양한 분야의 시험을 수행하게 된다. 특히 파이프라인 단계에서 효능을 입증받은 후보물질의 안전성이나 효능을 검증받기 위해 수행하는 비임상 단계는 사람에게 직접적으로 투여하기 전에 설치류, 비설치류 및 영장류를 이용해 일반독성, 발암성, 생식발생독성, 유전독성, 면역독성, 안전성 약리 등 다양한 시험을 필수적으로 진행해야 한다. 사람에게서 나타날 수 있는 부작용을 최소화하기 위해 수행하는 반복적이고 다양한 비임상시험으로 인해 많은 실험동물의 희생이 따르는 부분은 그동안 필수불가결한 부분으로 여겨져 왔다. 실험동물 사용을 금지하는 세계적 추세그러나 2010년대 초반에 들어오면서 유럽에서는 실험동물의 윤리적 문제로 인해 동물실험 화장품 원료 등에 대한 동물실험을 금지했고, 동물실험을 수행한 화장품 원료 및 제품은 판매를 금지하도록 결정했다. 한국도 2017년부터 동물실험을 거쳐 만든 화장품을 유통하거나 판매할 수 없게 됐다. 2013년 미국에서 열린 FDA(Food and Drug Administration: 미국 식품의약국) 주최 워크숍의 주제는 ‘실험동물을 사용하지 않는 독
-
과학과 놀자
끓는점 차이 이용해 원유를 LPG·휘발유·경유 등으로 분리
화학공학과에서 자주 듣는 질문 중 하나는 '석유는 언제쯤 고갈될까'이다. 흥미로운 사실은 2018년 원유의 가채연수(확인 매장량을 현재의 연간 생산량으로 나눈 값으로 앞으로 채굴 가능한 기간을 의미)는 50년인데, 30년 전에 예상한 가채연수는 43년이었다. 매년 엄청난 양의 석유가 사용되지만, 매장량은 오히려 늘어난 이유는 무엇일까? 매장량의 간단한 정의는 '불확실성 없이 검증된 기술로 상업적으로 생산할 수 있는 양'이다. 반면, 시추로 확인했지만 상업적으로 생산하기 힘든 경우 '발견 잠재 자원량'이라고 하며, 석유가 있을 가능성은있지만 시추로 확인하지 못한 경우를 '탐사 자원량'이라고 한다.두 자원량은 매장량에 포함되지 않지만 유가 상승, 정부 규제 완화, 또는 생산기술 발전에 따라 매장량으로 편입될 수 있다. 게다가 석유자원 개발 회사가 원활한 회사 운영을 위해 40~50년간의 매장량을 확보하기 때문에 그동안 가채연수는 40~50년으로 유지돼 왔다. 석유란 무엇일까석유(petroleum)는 암석을 뜻하는 그리스어 petro와 기름을 뜻하는 라틴어 oleum이 합쳐져 만들어졌다. 정제하지 않은 석유를 원유라고 하며, 이를 증류와 같은 정유공정을 통해 만든 제품을 석유제품이라고 한다. 석유는 탄소 87~83%, 수소 14~10%, 질소 2.0~0.1%, 산소 1.5~0.05%, 황 6~0.05%, 금속(바나듐, 니켈, 철 등) 1000ppm 이하 질량비율로 이루어져 있다. 석유는 액체이므로 수송 및 사용이 용이하고 열량이 높고 불순물이 적어 완전연소가 가능한 장점이 있다. 정유산업: 끓는점 차이로 제품을 나누다정유산업은 정육점과 비슷한 특징을 가진다. 정육점에서는 도축된 소를 뼈와 근육을 기준으로 안심, 등심
-
커버스토리
기술의 진화…미래 직업은 어떻게 변할까
데이터 분석과 마케팅 등 광고 관련 업무 전반을 대행해 유튜버 등이 양질의 콘텐츠 생산에 집중하도록 돕는 ‘크리에이터 광고 관리사’, 고령자들이 농촌에서 스마트농장을 운영하도록 지원하는 ‘실버 리부터(rebooter)’, 지역사회 문제를 공공·민간·시민협력을 통해 해결하도록 이끄는 ‘적정기술 리빙랩 전문가’….한국고용정보원이 지난 20일 ‘제1회 대한민국 신직업·미래직업 아이디어 공모전’ 수상작으로 선정한 직업들이다. 아직은 없지만 가까운 미래에 생겨날 것으로 전망되는 일자리다. 패션 온라인마켓에 가상현실(VR)을 도입해 고객의 선택을 돕는 ‘F-V 마케터’, 유튜버의 이미지 관리를 돕는 ‘유튜버 평판관리전문가’ 등도 충분히 가능한 일자리로 보여 수상작에 포함됐다.역사의 변천사는 곧 직업의 변천사다. 시대가 변하고 산업이 발전함에 따라 직업도 변한다. 과거에는 각광받았지만 기술 혁신으로 사라지는 직업이 있는가 하면 새로 생겨나는 직업도 많다. 30년 전만 해도 비행기 조종칸에 앉아 비행 고도와 항로 등을 계산해주던 항법사는 고소득 전문직이었지만 위성항법시스템(GPS) 등 관성항법장치가 발달하면서 순식간에 사라졌다. 20년 전 컴퓨터게임에 몰두했다면 부모의 꾸중을 들었겠지만 지금은 프로게이머가 청소년 사이에서 선호되는 직업이다. 마찬가지로 현재 성업 중이지만 조만간 사라지리라고 전망되는 일자리도 많다. 프로테니스·프로배구 보조심판과 통·번역사는 머잖아 인공지능(AI)으로 대체될 가능성이 크다는 것이 전문가들의 견해다.농경사회에서 산업사회, 산업사회에서 정보사회로 변화
-
커버스토리
AI·4차 산업혁명 시대…미래 내 직업은 어디서 찾을까
한국고용정보원이 지난 5월 발간한 ‘한국직업사전 통합본 제5판’에 따르면 한국의 직업은 1만6891개다. 1969년 첫 직업사전 발간 시 3260개에서 다섯 배 넘게 늘었다. 그동안 버스안내양 타이피스트 도안사 등 많은 직업이 사라지고 사회복지사 심리치료사 유튜버 등 더 많은 새로운 직업이 생겨난 결과다. 하지만 미국 3만여 개(2012년 기준), 일본 2만5000여 개, 캐나다 2만여 개 등 서비스산업이 활발한 국가에 비하면 아직 직업의 발달이 미흡한 편이다. 기술의 발전과 함께 직업이 더욱 세분화하고 전문화하는 경향을 보이는 점을 감안하면 한국의 직업도 더 늘어날 전망이다. 유망직업에서 소멸한 경우도 있어급속도로 산업화를 이루면서 한국의 유망직업도 부침을 거듭했다. 의사 변호사 공무원 대기업직원 등은 예전부터 꾸준히 사랑받았지만 한때 선호되는 직업들이 순식간에 인기를 잃거나 아예 사라지기도 했다. 전쟁의 상흔이 남은 1950년대에는 군 장교가 유망 직업이었고 타자를 쳐서 문서작업을 해주는 타이피스트도 지망자가 몰렸다. 전차운전사도 유망직업이었지만 1968년 서울에서 전차 노선이 폐지되면서 사라졌다. 1960년대에는 노동집약적 산업이 주목을 끌면서 섬유공학 엔지니어가 기업의 핵심인재로 꼽혔고, 대표적 수출상품이었던 가발을 만드는 가발기능공이나 9급 공무원보다 월급이 많았다는 버스안내양 등이 인기 직종으로 떠오르기도 했다. 1970년대는 중화학공업 발전과 함께 각종 산업엔지니어가 인기 직종이었고 자유롭게 해외로 나갈 수 있는 무역업(종합상사) 종사자와 항공기 승무원이 선망받는 직업이었다. 1980년대에는 노동집약적 산업이 자본집약형으로 발전하면서
-
숫자로 읽는 세상
스마트팩토리 구축한 포스코…세계 철강산업 선도
글로벌 철강기업 포스코가 생산공정에 인공지능(AI)을 도입하는 등 스마트팩토리를 구축하며 4차 산업혁명을 선도하고 있다. 포스코는 세계 최초로 철강 연속공정의 특성을 반영한 스마트팩토리 플랫폼인 포스프레임(PosFrame)을 자력 개발한 데 이어 철강업체로는 세계 최초로 생산공정 과정에 인공지능을 도입해 인공지능 제철소로 탈바꿈하고 있다.포스코의 스마트팩토리는 지난 50년간 축적된 현장 경험과 노하우에 사물인터넷(IoT), 빅데이터(Big Data), AI 기술을 접목해 최적의 생산현장을 구현함으로써 최고 품질의 제품을 가장 경제적으로 생산 공급하기 위한 것이다. 이를 통해 무(無)장애 조업체계를 실현하고, 품질 결함 요인을 사전에 파악해 불량을 최소화하는 한편, 작업장의 위험요소를 실시간으로 파악해 안전한 생산환경을 구현하고 있다.인공지능 활용해 최적의 생산공정 구축2016년 이세돌 9단이 알파고와의 바둑 시합에서 진 이후 딥러닝에 대한 관심이 높아지면서 포스코는 같은 해 하반기부터 딥러닝을 활용해 포항제철소의 2고로 스마트화부터 본격 추진했다. 현재 포항 2고로 스마트화를 시작으로 포항 3고로까지 인공지능 기술을 적용했으며, 올해 시설 업그레이드를 마치고 가동 예정인 광양 3고로도 인공지능 용광로로 탈바꿈할 예정이다.포스코는 딥러닝을 통한 인공지능을 구현해 용광로의 노황을 자동 제어한다. 석탄과 철광석의 상태를 고화질 카메라로 실시간 데이터화한 뒤 딥러닝 인공지능을 활용해 최적의 노황을 만드는 것이다. 예를 들어 용광로의 용선 온도는 1500도로 이보다 온도가 떨어지면 유동성이 안 좋아져서 조업이 잘 안 되고 온도 편차 없이 관리해야 연료비를 절감
-
경제 기타
양자컴퓨터가 뭐길래…구글·MS·삼성전자도 개발 참여
현존하는 세계 최강 슈퍼컴퓨터는 IBM의 ‘서밋’이다. 초당 33경(京) 번의 연산 능력과 함께 77만5000개의 중앙처리장치(CPU), 3만4000개의 그래픽처리장치(GPU)를 갖췄다. 신종 코로나바이러스 감염증(코로나19) 대유행을 계기로 8000여 개 화합물을 분석해 치료제 후보물질 7개를 추렸지만, 그 이상의 성과를 내놓지는 못했다.슈퍼컴퓨터보다 수십억배 빠른 양자컴퓨터언제 더 강력하게 출현할지 모르는 미지의 바이러스 퇴치 기술에 대한 관심이 뜨거운 가운데 슈퍼컴퓨터보다 수십억 배 이상 빠른 양자컴퓨터가 주목받고 있다. 양자컴퓨터는 양자물리학의 원리를 적용한 신개념 컴퓨터다. 비트(0 또는 1) 단위로 계산하는 기존 컴퓨터와 달리 큐비트(0이면서도 1) 단위를 이용해 정보 처리 속도를 획기적으로 높일 수 있다.양자컴퓨터 개발엔 구글, IBM, 마이크로소프트, 인텔, 삼성전자 등 글로벌 정보기술(IT) 기업들이 ‘게임 체인저’를 노리고 모두 뛰어들었다. 양자컴퓨터는 수조 개에 달하는 인체 내 세포와 단백질, DNA 등의 상호작용 분석에서 슈퍼컴퓨터보다 월등한 성능을 자랑한다. 구글은 지난해 10월 양자컴퓨터 시커모어를 내놓으며 일반 슈퍼컴퓨터보다 15억 배 빠른 성능을 지녔다고 발표했다. 구글이 미 항공우주국(NASA)과 함께 2015년 12월 ‘(슈퍼컴퓨터보다) 1억 배 빠른 컴퓨터’라고 소개한 지 4년이 채 안 돼 연산 성능이 15배 뛰었다. 시장조사업체 마켓리서치퓨처에 따르면 세계 양자컴퓨터 시장은 지난해 8억200만달러에서 2023년 28억2200만달러로 5년 새 세 배 이상으로 증가할 것으로 예상됐다.백신 개발·자율주행 등 모든 산업분야 혁신 이끌수 있어인류가 직면한 난제를 해