#데이터 시각화
-
학습 길잡이 기타
통계로 콜레라의 원인 밝혀낸 존 스노
지난 생글생글 제916호의 ‘재미있는 수학’에서는 플로렌스 나이팅게일의 장미 그림에 대해 알아보았습니다. 이번에는 역사적으로 의미 있는 창의적 그래프 중 장미 그림 외 다른 그래프의 사례를 알아보도록 하겠습니다.빅토리아 여왕 시대 영국의 의사이자 역학(epidemiology)의 창시자인 존 스노(John snow, 1813~1858)의 콜레라 지도 이야기입니다. 1854년 런던에서는 콜레라가 크게 유행했습니다. 콜레라는 심한 설사와 탈수 증상을 일으키는 장질환인데, 진행 속도가 매우 빨라 배앓이만 하다가 치료도 못 받고 죽을 만큼 무서운 질병이었습니다. 당시만 해도 콜레라의 발생 원인이나 치료법을 알 수 없었기에 사람들은 공포에 휩싸였습니다.영국에서는 콜레라로 인한 피해에 대해 광범위하고 체계적인 통계 조사를 시행했습니다. 이 작업은 감염병에 관한 통계조사로는 최초로 평가됩니다. 당시 조사를 맡은 의사 중 한 명인 윌리엄 파(William Farr, 1807~1883)는 통계조사를 토대로 분석한 결과 사람들이 사는 지대의 높이가 낮을수록 사망률이 높다고 봤습니다. 당시 런던은 세계에서 가장 큰 도시였는데, 하수 시설이 제대로 구축되어 있지 않아 오염된 물이 템스강으로 흘러들어 강물에서 심한 악취가 났습니다. 그래서 템스강에서 나는 악취가 콜레라의 원인일 것이라고 판단했습니다. 윌리엄 파는 본인 나름대로 데이터를 철저히 분석했지만, 콜레라의 원인을 잘못 짚었습니다.존 스노는 병원에 오는 환자들을 보며 이상함을 느꼈습니다. 콜레라가 공기에 의해 옮겨진다고 알려져 있었지만, 환자들의 증상을 보면 공기를 통한 전염이라고 보기에는 도저히 설명되지 않았습니다. 공기를 통한 전염이라면 증
-
학습 길잡이 기타
데이터 시각화…정보를 효과적으로 전달하려면?
데이터 시각화(Data Visualization)는 데이터를 차트, 그래프, 지도 등 시각적 요소로 표현해 정보를 쉽고 효과적으로 전달하는 과정으로, 복잡한 데이터를 한눈에 이해하고 분석할 수 있도록 돕습니다. 데이터 시각화와 유사한 용어로 인포그래픽이 있는데, 인포그래픽(Infographics)이란 인포메이션 그래픽(Information Graphics)의 줄임말로, 데이터를 시각적으로 표현한 것입니다. 데이터를 시각화하는 목적은 효과적인 정보 전달과 의사소통입니다. 이를 위해 사람들은 정보를 더 쉽고 빠르게 이해할 수 있도록 텍스트와 이미지를 이용해 정보를 시각화합니다. 사람들의 뇌는 이미지를 텍스트보다 앞서 받아들이는 경향이 있습니다. 그래서 사람들은 새로운 정보를 습득할 때, 글자를 읽는 것보다 이미지를 보는 것을 선호합니다. 데이터를 시각화할 때는 빠른 시간 내 많은 정보를 효과적으로 전달하기 위해 다양한 이미지를 사용하는데, 이를 부적절하게 이용하면 자료를 제대로 해석하지 못해 잘못 판단할 수도 있습니다.예를 들어보겠습니다. (그림1)은 우리나라 청소년(9~24세) 인구 추이를 나타내는 인포그래픽입니다. 이미지를 얼핏 보면 1980년에 비해 2025년의 청소년 수가 엄청 줄어든 듯합니다. 우리나라의 출산율이 점점 낮아지는 것을 생각하면 그럴 수 있겠다 싶습니다. 그런데 수치를 보니 1401만5000명에서 762만6000명이 된 것이니 거의 절반 정도 감소한 것을 알 수 있지만, 이미지상으로는 그보다 훨씬 많이 줄어든 것처럼 보입니다. 이는 우리가 이러한 이미지를 넓이의 개념으로 보기 때문입니다. 이미지를 그릴 때, 높이를 기준으로 1980년:2025년의 비를 2:1로 그렸지만, 이 이미지가 넓이 개념으로 더 다가