지난주에는 가상적인 사례로 그래프가 왜곡될 수 있는 경우를 설명했다.


이번 주에는 우리 주위에서 흔히 볼 수 있는 실제 사례들을 보자.
[재미있는 통계] 17. 왜곡된 정보를 주는 그래프들
[1] 첫 번째 예는 가장 흔한 것으로 그래프의 밑 부분을 잘라내는 것이다.


신문에 제시되는 많은 그래프가 지면 절약 등의 이유 때문에 이런 식으로 그려진다.


이런 그래프는 원래의 차이를 부풀리기는 하지만 속임수가 아닌 완전히 그래프이다.


화석연료란 태울 때 이산화탄소를 배출하는 석탄,석유 등의 연료를 말한다.


화석연료에서 배출된 이산화탄소는 온실효과에 따른 지구온난화의 주범으로 지목되고 있다.


위 그래프는 지구환경보호를 위한 화석연료의 사용 억제에 관한 기사에서 각국의 화석연료의존도를 나타낸 것이다.


프랑스는 의존도가 매우 낮은 52.5%이고 한국은 80.4%로서 프랑스에 비해 한국의 화석연료의존도가 높은 편이다.


하지만 밑이 잘린 그래프에서는 나라별로 그래프의 높이로 언뜻 판단하면 한국의 의존도가 프랑스에 비해 무려 7배 정도 높은 것 같은 인상을 주고 있다.


그래프의 밑 부분(0%에서 50%까지)을 생략하면 이처럼 국가 간의 차이가 인상적으로 부풀려지기 때문이 이 그래프는 우리나라가 지구온난화에 크게 기여(?)하고 있다는 인상을 준다.


하지만 실제로 전체 화석연료의 사용량에 있어서 한국은 미국, 프랑스, 일본보다는 훨씬 적다.



[2] 이 그래프는 대럴 허프(Darrel Huff)가 쓴 '통계로 거짓말 하는 방법(How To Lie With Statistics)'이란 책에 제시된 것으로 세로축의 눈금을 바꿈으로써 안정된 공무원의 봉급이 수직상승하고 있는 것처럼 그릴 수도 있음을 보여 준다.


1937년도 미국 공무원의 총 급여액이 1,950만 달러에서 2,000만 달러로 불과 4% 증가하였는데(왼쪽 그래프) 눈금이 바뀐 오른쪽 그래프에선 무려 400%의 증가로 과장되어 공무원의 봉급이 급상승하고 있다는 잘못된 인상을 강요하고 있다.


똑같은 자료를 가지고도 오른쪽 그래프로는 공무원봉급이 급상승 중이라고 주장할 수도 있는 것이다.


그래프를 그리는 사람이 우선 지켜야할 사항은 그래프 눈금의 크기를 일관성 있게 유지하는 것이다.


그러나 신문지면에 등장하는 그래프에서조차 이런 기본적인 원칙이 지켜지지 않는 경우가 있음을 다음의 그래프가 보여주고 있다.



[3] 미국의 주요 일간지 중의 하나인 필라델피아 인콰이어러(The Philadelphia Inquirer)에 실린 그래프다.


이집트의 카이로에서 열린 세계인구회의에 관한 기사에서 빠르게 증가하는 세계 인구를 그래프로 나타냈다.


수직 축은 10억(billion)명 단위로 눈금이 표시되어 있는데 모두 같아야 할 한 눈금(10억 명)의 높이가 제각각이다.


더욱이 그래프 위쪽의 6에서 8 사이의 두 눈금의 높이가(20억 명) 중간 부분 2에서 3의 한 눈금 높이의(10억 명) 3분의 1밖에 되지 않고 있다.



[4] 이 그래프는 1977년 이후 땅값의 변화를 나타낸 것으로 만든 사람의 고민(?)과 창의력(?)이 그대로 드러나 있는 그래프이다.


1992년 전국의 땅값(지가지수로 표현)은 1975년을 100이라 할 때,14.8배가 올랐고,10년 전인 82년에 비해서는 400%,5년 전인 87년에 비해서는 230%가 올랐다.


그러나 땅값은 75년 이후 처음으로 92년에는 91년에 비해 1.3%가 하락하였다.


사두기만 하면 오른다는 부동산의 신화가 깨지기 시작하고 있다는 내용의 기사에서 그 사실을 그래프로 크게 부각하고 싶을 것이다.


그러나 그 동안의 매년 20% 정도의 높은 상승률에 비해서 91년과 92년 사이의 1.3%의 하락율은 미미할 정도로 작은 것이 문제였다.


제대로 그래프를 그린다면,즉 같은 눈금을 유지한다면 1.3%의 하락은 거의 눈에 두드러지게 나타나지 않을 것이다.


그래서 편법을 써서 만든 것이 위의 그래프이다.


그래프에는 80년대의 지속적이고 높은 땅값 상승이 잘 나타나고 있고 91년-92년 사이의 소폭의 1.3% 하락도 적당히 눈에 두드러지게 나타나 있다.


주의해서 보아야 할 것은 바로 92년도에는 수직 축이 절단되어 있는 것이다.


수직 축의 절단표시는 아마도 그래프의 밑 부분이 잘렸거나 눈금의 크기가 바꾸어 졌음을 나타내는 창의적인(?) 의도일 것이다.


즉 91년까지의 눈금에 비해 92년에는 작은 차이도 크게 나타나도록 눈금을 바꾼 것이다.


물론 땅값의 첫 하락을 크게 보도하는 기사 속에서 이 하락을 두드러지게 하는 이 그래프가 기사를 뒷받침하는데 도움을 주었을 것이다.


하지만 하나의 그래프 안에서 땅값의 변화를 나타내는데 년도별로 다른 눈금을 사용하는 것은 그래프 만드는 사람에게 허용된 권한을 벗어나는 것이다.


하긴 땅값상승이 당연시되던 시기에 소폭이나마 하락했으니 좋은 기사 감이고 그래프도 그 변화를 잘 보여주도록 창의적(?)으로 만들어 졌지만 그래프 자체는 모범적이지 않으며 올바른 비교를 못하게 하고 있다.


그래프를 만드는 사람의 창의력은 데이터의 본질을 파악하고 그 안에 있는 중요한 변화와 크기를 그대로 전달하는데 발휘되어야지 억지로 눈금이나 축을 변화시켜 본래의 차이를 과장하는데 써서는 안될 것이다.



[결론] 그래프를 보는 사람의 입장에서 그래프의(특히 선 그래프)의 공정성을 평가하기 위해서는 두 가지 질문을 던져야 한다.


첫째는 그래프가 전체 그림을 보여주고 있는가 하는 것이다.


그래프의 밑 부분이 잘라져 있는지,축을 변화시킨다면 전혀 다른 인상을 주는 그래프가 될 수 있는지,만일 그렇다면 데이터를 왜곡하지 않고 바른 모양을 나타내는 그래프는 어떤 것인가를 반문해야 한다.


또한 축이 무엇을 나타내는지 표시가 안된 그래프는 의도적으로 과장하거나 속이기 위한 것이 대부분이다.


둘째는 눈금이 (특히 수직 축의) 과장되어 있지 않은가 하는 물음이다.


과장된 눈금은 잘못된 인상을 독자들에게 강요하는 경우가 많다.


그러면 과장되지 않은 적절한 눈금이란 어떤 눈금일까?그 답은 데이터에 포함된 중요한 차이나 흐름의 변화를 꼭 보여주어야 하는 동시에 별로 중요하지 않은 것들이 과장되지 않도록 눈금을 정하는 것이다.


따라서 적정한 눈금의 크기를 정하는 것은 그래프를 만드는 사람의 데이터의 본질에 대한 이해와 경험에 의존하게 된다.


김진호 jhkim@kndu.ac.kr


[ 약력 ]


△서울대 경영대 졸업


△미국 펜실베이니아대 와튼스쿨 경영학 석·박사


△(전)KBS 선거예측조사 자문위원


△(현)국방대 경영학과 교수