Cover Story - 통계의 함정…숫자를 맹신하지 마라
우리가 많이 사용하는 평균에는 여러 종류가 있다. 평균을 정확하게 알려면 산술평균, 중앙값, 최빈수로 나눠봐야 한다. 산술평균을 평균의 전부로 알면 통계에 속기 십상이다. 7명의 점수가 각각 1, 1, 2, 3, 1, 3, 4인 경우 산술평균은 2.1(더한 값을 7로 나누기)이다. 중심을 잘 나타내는 대표값이라고 할 수 있다. 하지만 1, 1, 2, 3, 1, 3, 17인 경우 같은 방법으로 평균점수가 4점이라고 할 수 있을까? 4는 전혀 대표값 역할을 못한다.이때 필요한 것이 중앙값과 최빈수다. 중앙값은 숫자를 크기 순으로 나란히 세웠을 때 중앙에 있는 위치의 값을 말한다. 반은 중앙값보다 크고, 반은 중앙값보다 작다. 두 사례의 중앙값은 2다. 대표성을 갖는다. 최빈수는 가장 흔히 나타나는 수다. 두 사례에선 1이다. 가장 많이 일어난 숫자다. 선거에서 A후보가 34%, B후보가 33%, C후보가 33% 득표한 경우 과반수 미달이지만 34%가 가장 많이 일어난 수를 가진 최빈수 대표값으로 맞다.
평균값을 잘못 사용하면 엉뚱한 정책과 예산집행이 이뤄진다. 복지대상자를 선정할 때 평균값, 중앙값, 최빈수 중 어느 것을 기준점으로 잡느냐에 따라 복지대상자의 숫자와 예산액의 크기가 달라질 수밖에 없다. 우리는 잘 속는다.
장재영 인턴기자(동국대 신문방송학과 4년) lvoice816@gmail.com