[재미있는 통계] 22. 제대로 된 표본조사엔 왜곡이 없다

우리는 바야흐로 각종 조사의 홍수 속에 묻혀 살고 있다.


사회의 민주화,국민의 알 권리에 대한 충족,그리고 몇 번의 선거 경험을 통해 이제는 '최근 조사에 따르면'이라는 문화에 익숙해져 있다.


대부분의 사람들은 한번쯤 전화조사에 응답해야 했던 경험이 있을 것이다.


신문과 TV에서는 각종 그래프와 수치로 장식된 다양한 조사결과를 쉴 사이 없이 발표하고 있다.


이제 어떤 주장이나 기사도 조사 결과를 요약한 숫자와 함께 제시되지 않으면 무언가 근거가 없는,비과학적인 것처럼 받아들여진다.


그러나 사람들이 다양한 조사결과를 항상 올바르게 이해하지 못하는 것 같다.


조사를 하는 사람이나 조사결과를 받아들이는 쪽 모두가 왜곡된 정보를 주고 받게 될 위험이 매우 높다.


이런 가능성을 풍자한 여론조사에 비판적인 유머에는 이런 것도 있다.




어떤 사람이 수학자에게 2+2는 얼마냐고 물었다.


수학자는 4라고 퉁명스럽게 대답했다.


대답이 너무 간단해 옆에 있던 통계학자에게 다시 물었다.


통계학자는 답은 신뢰수준 100%에서 4이며 오차한계는 0이라고 말했다.


대답이 너무 복잡해 이제는 옆에 있던 여론조사자에게 2+2는 얼마냐고 다시 물었다.


질문을 받은 여론조사자는 심각한 표정을 짓더니 주위를 조심스럽게 둘러보고 창문을 닫으며 커튼을 내린 뒤,질문한 사람의 귀를 당겨 긴장된 목소리로 귓속말로 이렇게 되물었다.


"2 더하기 2가 몇이 되기를 원하십니까?"




이러한 왜곡의 가능성을 없애기 위해서는 조사결과를 받아들이는 사람들이 조사에 대한 안목을 길러야 한다.


일반인이 조사나 결과해석에 대한 안목을 높인다면 조사하는 사람들도 질적 수준을 갖춘 조사를 할 수밖에 없다.


조사에 대한 안목을 높인다는 말은 조사과정에서 발생할 수 있는 잘못을 이해하고,그런 잘못이 일어났을 때 그것을 피해가면서 결과를 올바르게 해석하는 것을 말한다.


조사결과를 대할 때 행간(行間)을 읽기 위해서는 조사방법에 대한 약간의 지식이 필요하다.


이번 주부터는 재미있는 사례를 통해 그러한 지식을 쉽게 습득할 수 있도록 하자.


조사에는 학문적인 주제를 연구하기 위한 학술조사,시장과 소비자의 행태에 주된 관심을 두는 시장조사,민심의 소재와 정책수립에 관련된 여론조사,그리고 선거와 직접적으로 관련된 선거여론조사 등 다양한 종류가 있다.


그러나 이러한 구분은 편의상 나눈 것일 뿐 실제로는 여러 목적이 혼합된 조사가 많다.


조사의 내용이나 목적이 다양해도 본질적으로 대부분의 조사는 같은 성격을 지닌다.


전체를 다 조사하는 것이 아니라 전체의 일부인 표본만 조사해 전체에 대해 예측하는 것이다.


그러나 표본만 조사해 그 결과를 갖고 전체를 예측하는 과정에서 여러가지 오류와 왜곡이 발생할 수 있다.


표본조사 과정은 긴 연결고리로 이어진 매듭에 비유할 수 있다.


각각의 연결고리가 모두 튼튼해야 견고한 매듭이 되듯이 훌륭한 조사도 각 단계가 올바르게 수행돼야 한다.


조사과정의 어느 한 단계에서라도 잘못이 있으면 전체의 조사는 신뢰성이 낮은 결과를 낳게 된다.


전체가 아닌 일부 표본을 조사하는 방법은 최근에 개발한 기법이 아니다.


아마 인류 역사만큼이나 오래된 방법일지도 모른다.


아주 오래 전 인류가 물물교환을 할 때 짐승 가죽을 쌀과 바꾸려던 우리 조상은 그 쌀이 오래되거나 변질된 것은 아닌지 우선 한줌을 쥐어 냄새도 맡아보고 몇 알 씹어도 보았을 것이다.


바로 표본조사를 한 것이다.


깍두기 담그는 솜씨가 좋은 내 이모에게 한번은 그렇게 맛있는 깍두기 담그는 비결이 무어냐고 물은 적이 있다.


이모 말인 즉,깍두기 맛은 무맛에 있다는 것이다.


그럼 맛있는 무는 어떻게 고르느냐고 물었다.


무는 얇은 껍질과 알찬 속이 중요한데 무를 살 때마다 일일이 다 잘라 검사할 수 없으니까 가장 좋은 방법은 한 무더기(같은 밭에서 수확한) 무에서 그 무들을 잘 대표하는 무를 하나 골라 그것을 잘라 겉과 속을 조사한다고 한다.


그 무가 나쁘면 전체 무가 좋지 않다고 판단해 한 개 값만 물어 주고 다른 가게로 가서 같은 방법을 반복한다.


한 무더기의 무에서 그 무더기를 대표하는 무를 찾아내는 것은 이모만의 비결이라고 했다.


한 가정주부의 맛있는 깍두기 담그는 비결에 지나지 않지만 그 속에는 표본조사의 가장 중요한 요소,즉 표본의 대표성에 대한 생활의 지혜가 담겨 있다.


그럼 표본의 대표성이란 무엇일까? 대표성에 대해 이야기하려면 먼저 모집단이라는 것과 표본에 대해 이야기해야 한다.


모집단이란 연구 대상이 되는 집단이라고 간단히 정의할 수 있다.


각종 조사의 목적은 특정 모집단의 특성(모여 있는 정도나 흩어진 정도,다시 말하면 평균이나 표준편차)에 관한 정보를 얻기 위한 것이라고 할 수 있다.


이 정보를 얻기 위해 모집단을 일일이 전부 조사하는 방법을 전수조사라고 한다.


우리나라 인구와 주택을 조사하기 위해 5년마다 한 번씩 하는 인구·주택조사가 대표적인 전수조사의 예다.


그러나 전수조사는 비용과 시간이 많이 들고 모집단이 무한이 많아 모두 조사하기 어려운 경우도 있다.


또한 전구 타이어 가전제품 등과 같이 성능을 조사하는 과정에서 제품이 파괴되는 경우에도 전수조사는 불가능하다.


따라서 대부분의 경우에는 모집단의 일부를 뽑아 이 표본에 대해서만 특성을 조사한 뒤 이를 근거로 모집단의 특성을 추정하는 방법,즉 표본조사를 한다.


표본조사는 적절하게 수행할 경우 전수조사보다 더 정확할 수도 있다.


예를 들어 큰 항아리에 가득 들어 있는 콩의 수를 센다고 할 때 전수조사를 서너 번 하더라도 세는 작업의 단조로움 때문에 오류가 생겨 셀 때마다 그 수가 차이나게 된다.


차라리 항아리에서 한 그릇의 콩을 퍼내 그 그릇 안의 콩을 정확히 센 뒤 항아리 속에 몇 그릇이 들어가는가를 감안해 전체 콩의 수를 추정하는 것이 쉽고 빠르고 정확할 수 있다.


전수조사에서 계산상의 오류에 대한 실제 예를 하나 들어 보자.국보 32호인 해인사의 팔만대장경 경판은 정확히 모두 몇 장일까? 그 대답은 '아직 아무도 정확히 모른다'이다.


일제 때인 1915년 실시한 전수조사에 따르면 경판 수는 8만1348장이었다.


1975년 실시된 문화제관리국의 전수조사에 따르면 경판 수는 8만1240장이었다.


1995년 유네스코 세계문화유산으로 지정돼 이제 세계적으로 유명해진 팔만대장경 경판이지만 아직 정확한 숫자는 모르는 것이다.


김진호 jhkim@kndu.ac.kr


[ 약력 ]


△서울대 경영대 졸업


△미국 펜실베이니아대 와튼스쿨 경영학 석·박사


△(전)KBS 선거예측조사 자문위원


△(현)국방대 경영학과 교수