상관관계는 그냥 우연의 일치인 경우가 많다.
아무렇게나 고른 두 변수를 조사했을 때 두 변수가 전혀 관계가 없는 경우보다 그냥 우연히 두 변수가 상관관계를 보이는 경우를 흔하게 볼 수 있다.
물론 여기서 언급되는 상관관계는 모두 통계적으로 유의미한(significant) 상관관계를 말한다.
담배소비량,피부암 환자 수,청소원의 월급,단층촬영기계의 수,의치 생산량,대학생 총수 등등.놀랍게도 이들 변수 간에는 대부분 상관관계가 존재할 것이다.
그리고 이러한 상관관계는 대부분 그냥 우연에 의해서 얻어지는 상관일 뿐이다.
문제는 이런 우연적인 상관관계를 어떤 인과관계가 있는 것처럼 해석할 때 생긴다.
인과관계를 잘못 판단한 가장 엉터리 주장의 예를 들어 보자.
미국에서 한 학자는 남자 아이들의 지능과 바지 길이 사이에 아주 높은 상관관계가 있다는 것을 알아냈다.
그래서 그는 남자아이들의 지능을 높일 수 있는 손쉬운 방법은 '바지 길이를 늘리는 것'이라는 제안을 하였다.
아무리 숫자에 자신이 없는 수 문맹에게도 그의 제안은 어딘가 이상하다는 느낌을 갖게 하였을 것이다.
미니 스커트의 길이와 경기 상황과의 상관 관계를 이용해서 미니 스커트의 길이로 그 해의 경기를 예측하는 경우가 있다.
미니 스커트의 길이가 무릎 위로 올라갈수록 경기가 좋아지고,반대로 무릎 아래로 내려갈수록 경기가 나빠질 것이라고 예측한다.
더욱이 여기에다 그럴 듯한 이유까지 덧붙인다.
치마 길이는 (혹은 노출의 정도는) 여자들의 낙관적인 혹은 비관적인 전망의 상대적인 정도를 나타낸다고 억측한다.
소비의 대부분은 여자들에 의해서 결정되므로 여성들의 전망에 따라 경기의 방향이 결정된다는 것이다.
실제로 스커트의 길이와 경기지수 사이에 상관 관계가 입증되었는지 확인할 수는 없으나 만일 상관이 있다고 하더라도 그냥 우연히 관계가 있는 것일 뿐이다.
인과 관계의 조건 중 하나가 '원인은 결과에 앞서서 발생한다'는 것이다.
그러나 이것은 여러 조건 중 하나일 뿐이며,이 조건을 만족한다고 하더라도 인과 관계가 있다고 단정 지을 수는 없다.
즉 A가 일어난 다음 B가 일어났다고 해서 A가 B의 원인이라고 결론 짓는 것은 명백한 오류이며 이를 전후 인과의 오류(post hoc fallacy)라고 한다.
벽에 나란히 걸려 있는 두 개의 시계 A, B가 있다고 하자.시계 A가 시간을 알리면 이어서 시계 B도 땡땡땡 종을 울린다면 시계 A가 원인이 되어서 시계 B가 종을 친다고 생각하는 것이 바로 이 오류다.
우리가 흔히 쓰는 표현에 '오비이락(烏飛梨落)',즉 '까마귀 날자 배 떨어진다'라는 말이 있다.
까마귀가 날아간 후 우연히 배가 떨어졌을 뿐이지 까마귀가 원인이 되어서(배를 쪼아서) 배가 떨어진 것으로 생각하지 말라는 의미이다.
이러한 경고에도 불구하고 전후인과의 오류는 종종 일어난다.
'닭 모가지를 비틀어도 새벽은 온다'라는 말이 있다.
민주화를 위해 투쟁하던 사람들이 고난을 겪을 때 믿고 의지하며 구호처럼 사용하던 말이다.
닭이 운 다음에 새벽이 오니까 새벽이 오지 않게 하려고 닭 목을 비튼다면 전후 인과의 오류를 범하는 것이다.
마찬가지로 민주화는 역사적 순리에 따라 이루어지게 되어 있으므로 민주화 투사를 탄압한다고 민주화를 막을 수 있는 것은 아니라는 의미이다.
그러나 전후 인과의 오류가 쉽게 두드러지지 않는 경우에는 이런 오류를 설득당하기 쉽다.
한 학자가 흡연하는 학생의 대학 성적이 비흡연 학생에 비해서 나쁜가를 공들여 조사한 적이 있었다.
조사 결과 그렇다는 사실이 드러났다.
이 결과는 많은 사람들에게(특히 금연 운동가들) 흡연의 단점을 강조하는 데 중요한 근거로 활용되었다.
'성적을 올리려면 담배를 끊어라'라든가, 아니면 조금 과장해서 '담배는 지능을 저하시킨다'라고 주장하였다.
이런 주장을 어떻게 받아들여야 할까?
첫째는 이러한 상관 관계를 별 의미가 없는,그냥 우연한 것으로 해석할 수 있다.
둘째는 상관 관계가 우연한 것이 아니라면 인과 관계를 추정하는 데 있어서 전후 인과의 오류를 범하고 있을 수도 있다.
흡연하기 때문에 성적이 나빠졌다는,그래서 흡연이 성적 불량의 원인이라고 일방적으로 판단하는 것은 문제가 있다.
우선은 반대의 결론도 성립할 수 있다.
즉 성적 불량이 고민이 되어 흡연하게 되었을 수도 있다.
또한 상호 작용의 가능성도 있다.
성적 불량이 흡연으로 이어지고 흡연은 다시 성적 불량으로 이어지는 상호 작용을 생각해 볼 수도 있다.
그 외에도 제3의 요인들이 작용할지 모른다.
예를 들어 사교적인 사람,외향적인 사람은 흡연할 확률이 더 높을 것이며 이런 사람들은 활동적인 것에 시간을 빼앗겨 공부를 소홀히 할 수도 있다.
상관 관계가 있다고 할 때 흔히 생각하는 것과 반대 방향으로 인과 관계가 작용할 수도 있다는 것을 알아야 한다.
한 스포츠 평론가가 칼럼에서 승률이 나쁜 대학 미식축구팀은 감독을 너무 쉽게 해고한다고 주장했다.
그의 주장을 뒷받침하기 위해 그는 감독을 자주 바꾼 대학이 한 사람이 오래 감독한 대학보다 승률이 낮다는 통계 자료를 제시했다.
그러나 그의 논리가 과연 맞는 것일까? 감독을 바꾸는 것이 팀이 지는 것의 원인이 될 수는 없다.
원인과 결과는 반대인 것이다.
즉 팀이 계속 지게 되면 그 다음에 감독을 갈아치우게 되므로 감독의 해고는 연패(連敗)의 결과인 것이다.
원인과 결과가 사람들의 생각과는 반대 방향으로 작용하지만 그것이 쉽게 드러나지 않는 경우도 있다.
미국 통계를 보면 대학 졸업 여부와 소득과는 상관 관계가 높은 것으로 입증되어 있다.
물론 예외는 수없이 많지만 이 상관 관계는 매우 높고 명백한 것처럼 보인다.
이 상관 관계로부터 사람들은 대학을 나온 사람이 소득이 높은 이유는 대학을 나왔기 때문이라고 생각한다.
과연 그럴까? 소득이 높기 때문에 대학을 나왔다고 반대로 해석할 수도 있을 것이다.
이를 입증해 주는 사실이 있다.
미국에서 대학에 가는 학생은 두 종류가 있다고 한다.
머리가 좋은 학생과 집안이 부유한 학생이다.
머리가 좋은 학생은 대학에 가지 않더라도 높은 소득을 올릴 수 있는 능력이 있을 것이다.
가정이 부유한 학생의 경우에는 대학에 가건 말건 어차피 고소득층에 낄 것이다.
승용차가 한 대 있는 가정에서 차를 한 대 더 구입한다고 하자.상식적으로는 차량당 주행 거리가 줄어들 것이라고 생각된다.
그러나 실제로는 그렇지 않다.
미국의 통계를 보면 가정에서 차의 보유 대수가 늘어나면 차량당 평균 주행거리도 증가하는 것으로 나타나고 있다.
사람들은 이 상관 관계를 '차량 보유 대수가 늘어날수록 차를 몰려는 마음이 더 생긴다'라고 해석한다.
그러나 그 반대로 인과 관계를 해석하는 것이 자연스러울 것이다.
즉 운전을 많이 하는 가정에서 차의 필요성을 느껴 차를 한 대 더 구입하는 것이다.
김진호 교수 jhkim@kndu.ac.kr
[ 약력 ]
△서울대 경영대 졸업
△미국 펜실베이니아대 와튼스쿨 경영학 석·박사
△(전)KBS 선거예측조사 자문위원
△(현)국방대 경영학과 교수
아무렇게나 고른 두 변수를 조사했을 때 두 변수가 전혀 관계가 없는 경우보다 그냥 우연히 두 변수가 상관관계를 보이는 경우를 흔하게 볼 수 있다.
물론 여기서 언급되는 상관관계는 모두 통계적으로 유의미한(significant) 상관관계를 말한다.
담배소비량,피부암 환자 수,청소원의 월급,단층촬영기계의 수,의치 생산량,대학생 총수 등등.놀랍게도 이들 변수 간에는 대부분 상관관계가 존재할 것이다.
그리고 이러한 상관관계는 대부분 그냥 우연에 의해서 얻어지는 상관일 뿐이다.
문제는 이런 우연적인 상관관계를 어떤 인과관계가 있는 것처럼 해석할 때 생긴다.
인과관계를 잘못 판단한 가장 엉터리 주장의 예를 들어 보자.
미국에서 한 학자는 남자 아이들의 지능과 바지 길이 사이에 아주 높은 상관관계가 있다는 것을 알아냈다.
그래서 그는 남자아이들의 지능을 높일 수 있는 손쉬운 방법은 '바지 길이를 늘리는 것'이라는 제안을 하였다.
아무리 숫자에 자신이 없는 수 문맹에게도 그의 제안은 어딘가 이상하다는 느낌을 갖게 하였을 것이다.
미니 스커트의 길이와 경기 상황과의 상관 관계를 이용해서 미니 스커트의 길이로 그 해의 경기를 예측하는 경우가 있다.
미니 스커트의 길이가 무릎 위로 올라갈수록 경기가 좋아지고,반대로 무릎 아래로 내려갈수록 경기가 나빠질 것이라고 예측한다.
더욱이 여기에다 그럴 듯한 이유까지 덧붙인다.
치마 길이는 (혹은 노출의 정도는) 여자들의 낙관적인 혹은 비관적인 전망의 상대적인 정도를 나타낸다고 억측한다.
소비의 대부분은 여자들에 의해서 결정되므로 여성들의 전망에 따라 경기의 방향이 결정된다는 것이다.
실제로 스커트의 길이와 경기지수 사이에 상관 관계가 입증되었는지 확인할 수는 없으나 만일 상관이 있다고 하더라도 그냥 우연히 관계가 있는 것일 뿐이다.
인과 관계의 조건 중 하나가 '원인은 결과에 앞서서 발생한다'는 것이다.
그러나 이것은 여러 조건 중 하나일 뿐이며,이 조건을 만족한다고 하더라도 인과 관계가 있다고 단정 지을 수는 없다.
즉 A가 일어난 다음 B가 일어났다고 해서 A가 B의 원인이라고 결론 짓는 것은 명백한 오류이며 이를 전후 인과의 오류(post hoc fallacy)라고 한다.
벽에 나란히 걸려 있는 두 개의 시계 A, B가 있다고 하자.시계 A가 시간을 알리면 이어서 시계 B도 땡땡땡 종을 울린다면 시계 A가 원인이 되어서 시계 B가 종을 친다고 생각하는 것이 바로 이 오류다.
우리가 흔히 쓰는 표현에 '오비이락(烏飛梨落)',즉 '까마귀 날자 배 떨어진다'라는 말이 있다.
까마귀가 날아간 후 우연히 배가 떨어졌을 뿐이지 까마귀가 원인이 되어서(배를 쪼아서) 배가 떨어진 것으로 생각하지 말라는 의미이다.
이러한 경고에도 불구하고 전후인과의 오류는 종종 일어난다.
'닭 모가지를 비틀어도 새벽은 온다'라는 말이 있다.
민주화를 위해 투쟁하던 사람들이 고난을 겪을 때 믿고 의지하며 구호처럼 사용하던 말이다.
닭이 운 다음에 새벽이 오니까 새벽이 오지 않게 하려고 닭 목을 비튼다면 전후 인과의 오류를 범하는 것이다.
마찬가지로 민주화는 역사적 순리에 따라 이루어지게 되어 있으므로 민주화 투사를 탄압한다고 민주화를 막을 수 있는 것은 아니라는 의미이다.
그러나 전후 인과의 오류가 쉽게 두드러지지 않는 경우에는 이런 오류를 설득당하기 쉽다.
한 학자가 흡연하는 학생의 대학 성적이 비흡연 학생에 비해서 나쁜가를 공들여 조사한 적이 있었다.
조사 결과 그렇다는 사실이 드러났다.
이 결과는 많은 사람들에게(특히 금연 운동가들) 흡연의 단점을 강조하는 데 중요한 근거로 활용되었다.
'성적을 올리려면 담배를 끊어라'라든가, 아니면 조금 과장해서 '담배는 지능을 저하시킨다'라고 주장하였다.
이런 주장을 어떻게 받아들여야 할까?
첫째는 이러한 상관 관계를 별 의미가 없는,그냥 우연한 것으로 해석할 수 있다.
둘째는 상관 관계가 우연한 것이 아니라면 인과 관계를 추정하는 데 있어서 전후 인과의 오류를 범하고 있을 수도 있다.
흡연하기 때문에 성적이 나빠졌다는,그래서 흡연이 성적 불량의 원인이라고 일방적으로 판단하는 것은 문제가 있다.
우선은 반대의 결론도 성립할 수 있다.
즉 성적 불량이 고민이 되어 흡연하게 되었을 수도 있다.
또한 상호 작용의 가능성도 있다.
성적 불량이 흡연으로 이어지고 흡연은 다시 성적 불량으로 이어지는 상호 작용을 생각해 볼 수도 있다.
그 외에도 제3의 요인들이 작용할지 모른다.
예를 들어 사교적인 사람,외향적인 사람은 흡연할 확률이 더 높을 것이며 이런 사람들은 활동적인 것에 시간을 빼앗겨 공부를 소홀히 할 수도 있다.
상관 관계가 있다고 할 때 흔히 생각하는 것과 반대 방향으로 인과 관계가 작용할 수도 있다는 것을 알아야 한다.
한 스포츠 평론가가 칼럼에서 승률이 나쁜 대학 미식축구팀은 감독을 너무 쉽게 해고한다고 주장했다.
그의 주장을 뒷받침하기 위해 그는 감독을 자주 바꾼 대학이 한 사람이 오래 감독한 대학보다 승률이 낮다는 통계 자료를 제시했다.
그러나 그의 논리가 과연 맞는 것일까? 감독을 바꾸는 것이 팀이 지는 것의 원인이 될 수는 없다.
원인과 결과는 반대인 것이다.
즉 팀이 계속 지게 되면 그 다음에 감독을 갈아치우게 되므로 감독의 해고는 연패(連敗)의 결과인 것이다.
원인과 결과가 사람들의 생각과는 반대 방향으로 작용하지만 그것이 쉽게 드러나지 않는 경우도 있다.
미국 통계를 보면 대학 졸업 여부와 소득과는 상관 관계가 높은 것으로 입증되어 있다.
물론 예외는 수없이 많지만 이 상관 관계는 매우 높고 명백한 것처럼 보인다.
이 상관 관계로부터 사람들은 대학을 나온 사람이 소득이 높은 이유는 대학을 나왔기 때문이라고 생각한다.
과연 그럴까? 소득이 높기 때문에 대학을 나왔다고 반대로 해석할 수도 있을 것이다.
이를 입증해 주는 사실이 있다.
미국에서 대학에 가는 학생은 두 종류가 있다고 한다.
머리가 좋은 학생과 집안이 부유한 학생이다.
머리가 좋은 학생은 대학에 가지 않더라도 높은 소득을 올릴 수 있는 능력이 있을 것이다.
가정이 부유한 학생의 경우에는 대학에 가건 말건 어차피 고소득층에 낄 것이다.
승용차가 한 대 있는 가정에서 차를 한 대 더 구입한다고 하자.상식적으로는 차량당 주행 거리가 줄어들 것이라고 생각된다.
그러나 실제로는 그렇지 않다.
미국의 통계를 보면 가정에서 차의 보유 대수가 늘어나면 차량당 평균 주행거리도 증가하는 것으로 나타나고 있다.
사람들은 이 상관 관계를 '차량 보유 대수가 늘어날수록 차를 몰려는 마음이 더 생긴다'라고 해석한다.
그러나 그 반대로 인과 관계를 해석하는 것이 자연스러울 것이다.
즉 운전을 많이 하는 가정에서 차의 필요성을 느껴 차를 한 대 더 구입하는 것이다.
김진호 교수 jhkim@kndu.ac.kr
[ 약력 ]
△서울대 경영대 졸업
△미국 펜실베이니아대 와튼스쿨 경영학 석·박사
△(전)KBS 선거예측조사 자문위원
△(현)국방대 경영학과 교수