"내가 젊은 변호사였을 때는 이겨야 했을 많은 사건을 졌고 나이가 들어감에 따라 져야 했을 많은 사건을 이겼다. 따라서 평균적으로는 법의 정의가 실현되었다."
이 말은 영국의 유명한 판사인 매듀스 경이 은퇴하면서 한 말이다.
이처럼 평균은 숫자들이 모여 있는 정도를 나타내는 유용한 정보이지만 분포 전체의 모양을 보여주지는 못한다.
때로는 모여 있는 정도보다 흩어져 있는 정도를 나타내는 대표값이 더 중요한 경우가 많다.
흩어져 있는 정도란 데이터가 얼마나 퍼져 있느냐,즉 각각의 숫자들이 얼마나 서로 다른가를 나타낸다.
간단한 예로 2, 2, 2, 2, 2는 전혀 흩어져 있지 않은 숫자들이고 1, 5, 10, 15, 30은 많이 흩어져 있다.
아래의 그래프는 평균(산술평균,중앙값,최빈수)은 같지만 흩어진 정도가 다른 두 학급의 성적 분포를 나타낸 것이다. 두 학급의 성적에 대해 어떤 비교나 결론을 끄집어내기 위해서는 흩어진 정도를 반드시 알아야 한다는 것을 시각적으로 보여주고 있다.
흩어진 정도를 나타내는 가장 간단한 측정치는 범위(range)로서 '최소값과 최대값 간의 차이'를 말한다.
이 차이가 크면 클수록 많이 흩어져 있는 것이다.
그러나 흩어진 정도의 측정치로 가장 널리 쓰이는 것은 표준 편차인데,그 값이 클수록 산술 평균을 중심으로 많이 흩어져 있게 된다.
표준 편차 대신 분산을 사용하기도 하는데 표준 편차는 분산의 제곱근(root)을 취한 값이다.
평균값과 표준 편차를 함께 고려하면 중심의 대표값으로서의 평균의 역할을 판단할 수도 있다.
예를 들어 평균값에 비해 표준 편차가 크다면 자료들이 평균 주위에 넓게 흩어져 있는 것이다.
따라서 이런 경우 평균은 중심의 대표값으로서의 의미가 약해진다.
훈련 중 강을 걸어서 건너야 하는 병사들이 지도에 표시된 대로 평균 수심 1.3m라는 사실만 믿고 도강한다면 어떻게 될까? 운 나쁘게도 평균 주위에 흩어진 정도가 크다면(얕은 곳과 깊은 곳이 많다면) 많은 병사가 위험에 처하게 될 것이다.
마찬가지로 어떤 강의 평균 수심이 3m라는 정보는 그 강에서 다이빙하려는 선수를 안심시키지는 못한다.
뛰어내리기 전에 최소한 흩어진 정도에 대한 정보를 알아야 한다.
어느 대학에서 같은 과목을 두 교수가 가르친다고 하자.두 교수 모두 평균 C학점을 학생들에게 준다면 그 과목을 배우려는 학생들은 어떤 교수를 선택해도 마찬가지라고 생각할 것이다.
그러나 한 교수는 대부분의 학생들이 평범하다고 생각하여 C만 주고 다른 교수는 학생들이 반은 우수하고 반은 공부를 안 한다고 생각하여 A를 주거나 D-만 준다.
그러므로 이러한 흩어짐의 정보 없이 학생들이 평균 성적 C라는 사실만 가지고 교수를 선택한다면 학점 때문에 어려움에 처할 수도 있게 된다.
어떤 병에 걸린 환자에게 의사가 "이 병에 걸린 사람은 평균 5년밖에 못 산다"고 말한다면 의사는 환자에게 충분한 정보를 제공하는 것이 아니다.
평균 생존기간만 알고 생존 기간의 분포에 대해 모른다면 환자는 그에 맞는 투병 계획을 세울 수 없다.
평균 생존기간이 5년이라도 4년 반에서 5년 반 사이에 분포하는 경우(대개 5년 내외에 사망함)와 1년에서 20년 사이에 분포하는 경우(일찍 사망할 수도 있고 꽤 오래 생존하기도 함)의 환자의 투병 계획은 다를 것이다.
평균만을 갖고는 합리적인 의사 결정을 내릴 수 없으며 올바른 판단을 내리기 위해서는 평균 주위의 흩어진 정도도 함께 고려해야 한다.
결혼 상대자를 고르는 데 있어서도 평균 외에 흩어진 정도가 중요한 기준이 될 수 있다.
평균은 같더라도 여러 기준에 있어서 신부감(혹은 신랑감)들은 다양하게 차이가 날 수 있으며 이러한 차이가 개인적인 장점으로 작용하거나 선택의 이유로 작용할 수 있음을 다음의 인용문은 잘 나타내 준다.
'그러나 일생을 함께할 배우자로서는 평범이란 특징이 아무래도 마음에 들지 않는다. 평균으로 셈하면 결국 보통이 되고 말더라도 좀 들쭉날쭉하기를 바라는 게 솔직한 내 심정이다. 다시 말해,어떤 점에서는 평균에서 좀 뒤지더라도 어떤 점에서는 뛰어난 편이 낫다.' (이문열,「레테의 연가」,도서출판 둥지,1991,71쪽)
어떤 기준을 정해 놓고 그 기준과 다르면 '비정상'으로 느끼게끔 강요되는 사례가 적지 않다.
대표적인 것이 '평균적인 사람'이다.
특히 제품을 만드는 사람들이나 판매원들은 이 '평균적인 사람'에 대해 매혹적인 충동을 느낀다.
대량 생산의 필요성은 그 충동을 더 부채질한다.
물론 '평균적인 사람'들이 상대적으로 가장 큰 수요자이므로 그들에게 맞는 제품을 만들고 판매하려는 의도는 이해가 된다.
그러나 '평균적인 사람'에 대한 집착은 심한 경우가 많다.
주택 차 가구는 '평균적인 사람'들을 기준으로 만들어지는 대표적인 제품이다.
키 큰 사람은 승용차를 탈 때 자주 머리를 부딪치고 키 작은 사람은 운전시 어려움을 겪는다.
부엌에서 여자들이 사용하는 싱크대도 마찬가지로 여자들의 평균 키를 기준으로 만든다.
키가 작은 여자들은 싱크대를 사용할 때 팔이 당기고 큰 여자들은 구부리고 일해야 한다.
평균에서 다르면 비정상으로 느끼게 될 수밖에 없다.
그렇다고 비정상적인 사람들을 위한 물건을 만든다고 해서 현재의 대량생산 공정이 크게 위협받는 것은 아닐 것이다.
높이가 다른 다리를 사용하면 평균적이 아닌 사람들에게도 맞는 것을 간단히 만들 수 있다.
1995년에는 미국 우주비행사의 키가 커서 미국과 러시아의 공동 우주개발이 약간 차질을 빚은 적도 있다.
문제가 된 미국 비행사의 키는 1m82cm였는데,'비상시 사용해야 할지도 모를 러시아 소유즈 우주선 내 좌석의 높이보다 키가 2cm 더 크기 때문'이었다고 한다.
현재 우리나라의 청소년 수준에서도 그리 큰 키가 아닌데 문제가 됐다.
물론 우주선 안의 제한된 공간 때문에도 그랬겠지만 그래도 180cm 이하에만 맞는 의자를 만들었다니 차질을 빚어도 싸다.
김진호 jhkim@kndu.ac.kr
[ 약력 ]
△서울대 경영대 졸업
△미국 펜실베이니아대 와튼스쿨 경영학 석·박사
△(전)KBS 선거예측조사 자문위원
△(현)국방대 경영학과 교수
이 말은 영국의 유명한 판사인 매듀스 경이 은퇴하면서 한 말이다.
이처럼 평균은 숫자들이 모여 있는 정도를 나타내는 유용한 정보이지만 분포 전체의 모양을 보여주지는 못한다.
때로는 모여 있는 정도보다 흩어져 있는 정도를 나타내는 대표값이 더 중요한 경우가 많다.
흩어져 있는 정도란 데이터가 얼마나 퍼져 있느냐,즉 각각의 숫자들이 얼마나 서로 다른가를 나타낸다.
간단한 예로 2, 2, 2, 2, 2는 전혀 흩어져 있지 않은 숫자들이고 1, 5, 10, 15, 30은 많이 흩어져 있다.
아래의 그래프는 평균(산술평균,중앙값,최빈수)은 같지만 흩어진 정도가 다른 두 학급의 성적 분포를 나타낸 것이다. 두 학급의 성적에 대해 어떤 비교나 결론을 끄집어내기 위해서는 흩어진 정도를 반드시 알아야 한다는 것을 시각적으로 보여주고 있다.
흩어진 정도를 나타내는 가장 간단한 측정치는 범위(range)로서 '최소값과 최대값 간의 차이'를 말한다.
이 차이가 크면 클수록 많이 흩어져 있는 것이다.
그러나 흩어진 정도의 측정치로 가장 널리 쓰이는 것은 표준 편차인데,그 값이 클수록 산술 평균을 중심으로 많이 흩어져 있게 된다.
표준 편차 대신 분산을 사용하기도 하는데 표준 편차는 분산의 제곱근(root)을 취한 값이다.
평균값과 표준 편차를 함께 고려하면 중심의 대표값으로서의 평균의 역할을 판단할 수도 있다.
예를 들어 평균값에 비해 표준 편차가 크다면 자료들이 평균 주위에 넓게 흩어져 있는 것이다.
따라서 이런 경우 평균은 중심의 대표값으로서의 의미가 약해진다.
훈련 중 강을 걸어서 건너야 하는 병사들이 지도에 표시된 대로 평균 수심 1.3m라는 사실만 믿고 도강한다면 어떻게 될까? 운 나쁘게도 평균 주위에 흩어진 정도가 크다면(얕은 곳과 깊은 곳이 많다면) 많은 병사가 위험에 처하게 될 것이다.
마찬가지로 어떤 강의 평균 수심이 3m라는 정보는 그 강에서 다이빙하려는 선수를 안심시키지는 못한다.
뛰어내리기 전에 최소한 흩어진 정도에 대한 정보를 알아야 한다.
어느 대학에서 같은 과목을 두 교수가 가르친다고 하자.두 교수 모두 평균 C학점을 학생들에게 준다면 그 과목을 배우려는 학생들은 어떤 교수를 선택해도 마찬가지라고 생각할 것이다.
그러나 한 교수는 대부분의 학생들이 평범하다고 생각하여 C만 주고 다른 교수는 학생들이 반은 우수하고 반은 공부를 안 한다고 생각하여 A를 주거나 D-만 준다.
그러므로 이러한 흩어짐의 정보 없이 학생들이 평균 성적 C라는 사실만 가지고 교수를 선택한다면 학점 때문에 어려움에 처할 수도 있게 된다.
어떤 병에 걸린 환자에게 의사가 "이 병에 걸린 사람은 평균 5년밖에 못 산다"고 말한다면 의사는 환자에게 충분한 정보를 제공하는 것이 아니다.
평균 생존기간만 알고 생존 기간의 분포에 대해 모른다면 환자는 그에 맞는 투병 계획을 세울 수 없다.
평균 생존기간이 5년이라도 4년 반에서 5년 반 사이에 분포하는 경우(대개 5년 내외에 사망함)와 1년에서 20년 사이에 분포하는 경우(일찍 사망할 수도 있고 꽤 오래 생존하기도 함)의 환자의 투병 계획은 다를 것이다.
평균만을 갖고는 합리적인 의사 결정을 내릴 수 없으며 올바른 판단을 내리기 위해서는 평균 주위의 흩어진 정도도 함께 고려해야 한다.
결혼 상대자를 고르는 데 있어서도 평균 외에 흩어진 정도가 중요한 기준이 될 수 있다.
평균은 같더라도 여러 기준에 있어서 신부감(혹은 신랑감)들은 다양하게 차이가 날 수 있으며 이러한 차이가 개인적인 장점으로 작용하거나 선택의 이유로 작용할 수 있음을 다음의 인용문은 잘 나타내 준다.
'그러나 일생을 함께할 배우자로서는 평범이란 특징이 아무래도 마음에 들지 않는다. 평균으로 셈하면 결국 보통이 되고 말더라도 좀 들쭉날쭉하기를 바라는 게 솔직한 내 심정이다. 다시 말해,어떤 점에서는 평균에서 좀 뒤지더라도 어떤 점에서는 뛰어난 편이 낫다.' (이문열,「레테의 연가」,도서출판 둥지,1991,71쪽)
어떤 기준을 정해 놓고 그 기준과 다르면 '비정상'으로 느끼게끔 강요되는 사례가 적지 않다.
대표적인 것이 '평균적인 사람'이다.
특히 제품을 만드는 사람들이나 판매원들은 이 '평균적인 사람'에 대해 매혹적인 충동을 느낀다.
대량 생산의 필요성은 그 충동을 더 부채질한다.
물론 '평균적인 사람'들이 상대적으로 가장 큰 수요자이므로 그들에게 맞는 제품을 만들고 판매하려는 의도는 이해가 된다.
그러나 '평균적인 사람'에 대한 집착은 심한 경우가 많다.
주택 차 가구는 '평균적인 사람'들을 기준으로 만들어지는 대표적인 제품이다.
키 큰 사람은 승용차를 탈 때 자주 머리를 부딪치고 키 작은 사람은 운전시 어려움을 겪는다.
부엌에서 여자들이 사용하는 싱크대도 마찬가지로 여자들의 평균 키를 기준으로 만든다.
키가 작은 여자들은 싱크대를 사용할 때 팔이 당기고 큰 여자들은 구부리고 일해야 한다.
평균에서 다르면 비정상으로 느끼게 될 수밖에 없다.
그렇다고 비정상적인 사람들을 위한 물건을 만든다고 해서 현재의 대량생산 공정이 크게 위협받는 것은 아닐 것이다.
높이가 다른 다리를 사용하면 평균적이 아닌 사람들에게도 맞는 것을 간단히 만들 수 있다.
1995년에는 미국 우주비행사의 키가 커서 미국과 러시아의 공동 우주개발이 약간 차질을 빚은 적도 있다.
문제가 된 미국 비행사의 키는 1m82cm였는데,'비상시 사용해야 할지도 모를 러시아 소유즈 우주선 내 좌석의 높이보다 키가 2cm 더 크기 때문'이었다고 한다.
현재 우리나라의 청소년 수준에서도 그리 큰 키가 아닌데 문제가 됐다.
물론 우주선 안의 제한된 공간 때문에도 그랬겠지만 그래도 180cm 이하에만 맞는 의자를 만들었다니 차질을 빚어도 싸다.
김진호 jhkim@kndu.ac.kr
[ 약력 ]
△서울대 경영대 졸업
△미국 펜실베이니아대 와튼스쿨 경영학 석·박사
△(전)KBS 선거예측조사 자문위원
△(현)국방대 경영학과 교수