많은 숫자들을 요약해 설명할 수 있는 가장 효과적인 방법은 숫자들을 그래프를 사용하여 나타내는 것이다.그래프란 가로축,세로축,점,선,숫자,글자,심볼 등을 복합적으로 사용하여 양적인 숫자들을 시각적으로 요약한 것이다.


그래프를 대하는 사람의 입장에서는 익숙하지도 않은 많은 숫자들을 머리를 써서 생각할 필요도 없이 단지 보는 것만으로도 숫자들 속에 포함된 사실을 파악할 수 있는 장점이 있다.하지만 그래프를 그저 무비판적으로 본다면 필요한 정보를 얻기는 커녕 왜곡된 결론에 도달하기 쉽다.


많은 숫자(데이터)를 그래프로 그릴 때에는 가능한 한 간단하고 생기있게 그래프로 전달해야 한다.이때 중요한 것은 데이터를 단순화하면서도 데이터가 갖고 있는 중요한 정보를 정확하게 전달해야 하는 것이다.


그래프를 그리는 것은 언뜻 보기에 매우 쉬운 듯하지만 실제로 통계도표에서 속임수가 가장 많다는 사실은 데이터의 단순화과정에서 정확성을 유지하기가 어렵다는 것을 말해 준다.다시 말하면 데이터를 너무 단순화하면 그래프를 부정직하게 그리지는 않았더라도 실제와는 전혀 다른 인상을 주는 그래프가 될 수 있다.더욱이 그래프를 그리는 사람이 의도적으로 왜곡하여 그리게 되면 그래프는 사실에서 더욱 멀어지게 된다.


그래프 중에서 가장 흔한 것은 선을 이용한 선 그래프다.선 그래프는 그리기가 쉬울 뿐만 아니라 많은 숫자 속에 숨어있는 경향을 잘 나타내어 주기 때문에 데이터의 분석이나 예측에 가장 많이 쓰인다.그러나 데이터의 왜곡이 가장 많이 일어나는 그래프도 선 그래프다.선 그래프를 그릴 때 일어나는 잘못을 가상적인 예로 설명해보자.


고등학교 3학년에 올라가는 나과외 군은 지난 2년 동안 조집게 과외교사로부터 영어과목의 과외를 받았다.


조 선생은 매월 치른 나군의 학력고사 영어성적을 갖고 나군의 부모와 함께 3학년에 대비한 영어공부 계획을 논의하기로 돼 있다.


조 선생은 우선 그동안의 시험성적을 그래프로 나타내 보았다.


우선 가로축에는 24번의 시험순서를 표시하고 세로축에는 10점 단위로 점수를 표시했다.


나군의 월별 영어성적을 표시한 뒤 선을 그어 연결하였더니 다음과 같은 그림(도표 1)이 되었다.
[재미있는 통계] 16. 그래프에도 함정이 있다
이 그래프는 지난 2년 동안 영어성적이 매달 어떻게 변화했는가를 잘 나타내고 있다.


가끔씩 성적이 오르내리기는 했지만 지난 2년간 영어성적이 전체적으로는 75점에서 85점으로 10점 정도 상승했다.


또한 그래프의 제일 아래쪽에 0점이 표시되어 있어 점수 간 상호비교도 쉽고 한번만 봐도 성적 변화를 전체적으로 쉽게 이해할 수 있으므로 무난한 그래프라고 할 수 있다.


성적 증가 10점도 10점 증가처럼 보이고 그 상승 경향이 크기는 하지만 유별나게 큰 것도 아니라는 것을 보여주고 있다.


그러나 나군의 영어성적이 약간 올라갔기는 했지만 지난 2년간 과외지도를 해온 조 선생의 입장에서는 나군의 부모에게 성적 증가를 더욱 인상적으로 보이게 하고 또 앞으로 계속 과외를 맡기도록 설득하려면 아무래도 이 그래프는 만족스럽지 못했다.


그래서 이 그래프에서 빈 공간으로 남아있는 밑 부분을 잘라 보면 다음의 그림(도표 2)이 된다.


데이터는 같으므로 똑같은 그래프가 되지만 밑부분이 잘려져 나갔으므로 성적 곡선이 2년 동안 그래프 전체 높이의 3분의 1이나 상승하고 있다.


어떤 속임수를 쓴 것도 아닌데 그래프가 주는 인상은 크게 달라진다.


잘라진 밑부분은 보이지 않으므로 약간의 상승도 새 그래프에서는 시각적으로 크게 보이는 것이다.


하지만 지난 2년간 받은 고액과외비를 생각한다면 조 선생은 새 그래프보다도 성적이 더욱 인상적으로 보이게 하는 방법,즉 단순하지만 대단한 효과가 있는 속임수를 쓸 수도 있다.


다음 그림과 같이 그래프의 세로축 눈금을 변화시킴으로써 작은 차이도 눈에 확 띄는 변화로 보이도록 하는 것이다.


세로축의 눈금이 75점에서 85점만을 나타내도록 바꾸었더니 성적 상승,즉 조 선생의 과외효과가 너무나 두드러지게 나타났다.


이 그래프(도표 3)를 보이면서 "과외 덕에 성적이 10점이나 비약적으로 상승했습니다"라고 말하면 나군의 부모는 매우 만족스러워할 것이다.


수평축의 선택 역시 그래프를 그리는 사람이 강조하고자 하는 의도에 맞게 변화시킬 수 있다.


우선 수평축의 시작과 끝의 선택에 있어서 그래프가 원하는 모양이 나오도록 자유롭게 선택한다.


조 선생이 나군의 최근 성적변화를 보여주는 그래프가 자기에게 유리하다고 생각되면 18회 이후의 시험성적만으로 다음과 같은 그래프를 그릴 수 있다.


그동안의 과외수업의 결과로 이제 성적이 안정적,수직적으로 상승하고 있다고 말하고 싶은 경우에 조 선생은 이 그래프(도표 4)가 더 적당하다고 생각할 것이다.


수평축에 있어서 눈금의 변화는 데이터의 변화 정도를 원하는 의도대로 보이게 할 때 사용한다.


눈금을 촘촘하게 한다면 변화가 상하로 심하다는 인상을 줄 수 있고 그 반대의 경우에는 변화가 완만하게 진행되고 있다는 느낌을 준다.


만일 조 선생이 나군의 성적이 오르고 있기는 하지만 기복이 매우 심해서 앞으로는 좀 더 집중적으로 공부할 필요가 있다고 나군의 부모를 설득하고 싶다면 어떤 그래프가 필요할까? 그래프의 수평축을 좁히기만 하면 되는 것이다.


수평축이 축소된 그래프(도표 5)는 나군의 성적 기복이 심하다는 인상을 주는 데 충분할 것이다.


김진호 jhkim@kndu.ac.kr


[ 약력 ]


△서울대 경영대 졸업


△미국 펜실베이니아대 와튼스쿨 경영학 석·박사


△(전)KBS 선거예측조사 자문위원


△(현)국방대 경영학과 교수