사람들은 이것과 저것이 '관계가 있다',혹은 '관계가 없다'라는 표현을 자주 쓴다.

어떤 것들끼리의 관계는 통계적으로는 상관관계로 나타낸다.

상관관계는 어떤 변수가 증가할 때 다른 변수가 함께 증가하는가 혹은 감소하는가를 관찰하여 파악한다.

예를 들어 체중과 신장 사이에는 양의 상관관계가 있다고 할 수 있다.

키가 크면 대체적으로 체중이 증가한다는 의미다.

어떤 상품의 가격과 수요 사이에는 음의 상관관계가 있다고 할 수 있다.

가격이 오르면 대개 그 상품에 대한 수요는 줄어든다.


이러한 상관관계가 얼마나 밀접한가는 상관계수로 표시하는데 상관계수는 -1에서 1 사이의 값을 갖는다.

상관계수가 음수면 음의 상관을,반대로 양수면 양의 상관을 갖는다.

상관계수가 0이라는 것은 서로 관계가 전혀 없음을 의미한다.

좀 더 구체적으로 말하면 상관계수는 선형(線形: linear) 상관만을 측정하므로 상관계수가 0이라는 말은 선형관계가 존재하지 않는다는 의미다.

꽤 오래 전부터 사람들은 상관관계의 개념을 이해하고 생활에 적용해 왔던 것 같다.

그 중에서도 주로 여러 가지 현상들을 설명하기 위한 하나의 방법으로 그것을 그 전에 일어났던 다른 사건들과 관련시켜왔다.

그렇게 함으로써 좋은 일이나 나쁜 일에 대한 징조를 미리 알고 대처하려는 목적이었을 것이다.

소크라테스는 재채기를 그의 악처(惡妻)가 발작하는 조짐으로 믿어서 재채기가 나기 무섭게 집을 빠져나갔다고 한다.

특정 개인으로부터 시작된 조짐은 유사한 경험이 다른 사람에게도 반복되면 모든 사람에게 해당되는 징조로 발전된다.

거울이 깨지면 나쁜 일이 일어난다든가,상여가 지나가는 것을 보면 좋은 일이 일어난다든가 하는 믿음이 그 예다.

더욱이 이러한 상관관계에 대한 추측이 더 많은 데이터를 근거로 판단되어지고 세련된 체계를 갖추게 된 것도 있다.

별들의 움직임과 세상의 일을 관련짓는 점성술,골상(骨相),수상(手相),관상(觀相),족상(足相) 등이 그 예다.

문외한이기는 하지만 내 생각으로는 이러한 체계 중에서 주역(周易)은 출생의 사주(四柱)가 동양사상의 근본이 되는 음양(陰陽)이론과 접목되어 가장 세련된 체계를 갖춘 경지에 오른 것이 아닐까 한다.

오늘날에도 사람들은 상관관계에 바탕을 둔 판단에 영향을 받는다.

자동차보험의 예를 들어보자.운전자가 자동차보험에 가입하려면 먼저 여러가지 정보를 제공해야 한다.

그 중에서도 나이와 성별은 보험료를 산정하는 데 중요한 기준이 된다.

나이가 25세 미만이면 보험료가 올라가고,운전자가 여자라면 보험료가 낮아진다.

왜일까? 나이와 성별이 사고율과 상관관계가 있기 때문이다.

즉 나이가 젊을수록 사고율이 높고 여자는 남자에 비해 사고를 덜 내기 때문이다.

대학입시에서는 수학능력시험,내신성적,본고사성적 등이 함께 고려된다.

과연 어떤 성적이 학생의 학력을 잘 나타내는 성적인가 하는 문제는 이러한 성적과 입학 후 학생들의 성적과의 상관관계로 분석이 된다.

최근에 한 대학교 학생을 대상으로 조사한 연구에 따르면 수학능력시험이 대학에서의 성적과 상관관계가 가장 높게 나타났다고 한다.

다른 대학의 자료에서도 유사한 결과가 나온다면 굳이 본고사가 필요없다는 주장의 근거가 될 수 있는 것이다.

발이 큰 사람들은 종종 도둑놈 발을 가졌다는 소리를 듣는다고 한다.

도둑 중에는 발 큰 사람이 많았다는 말이다.

'코가 큰 사람은 그것도 크다'라는 말도 있다.

이런 상관관계는 물론 구체적인 자료로 입증되지 않은 우스개 소리에 불과할 수도 있고 오랫동안의 경험적인 근거에 바탕을 둔 상관관계를 나타낸 것일 수도 있다.

그리고 이 말 속에는 어떤 인과관계가 암시되어 있지는 않은 듯하다.

발이 크니까 도둑이 될 것이라든가,코가 크니까 그것이 클 것이라든가 하는 말을 심각하게 받아들이는 사람은 없을 것이다.

관상에서 나온 말이지만 거의 상식이 되다시피 한 '인중(人中)이 길면 오래 산다'는 말이 있다.

인중이란 코와 윗입술 사이의 오목한 부분을 말한다.

이 말을 어떻게 해석할 수 있을까? '오래 사는 사람 중에는 인중이 긴 사람이 많다'라고 해석하면 단순히 둘 사이에 상관관계가 있다는 것을 인정하는 것이다.

그러나 '인중이 긴 사람은 오래 산다'라고 해석한다면 둘 사이의 인과관계를 어느 정도 가정하고 있는 것이다.

그러면 과연 상관관계는 원인과 결과의 관계를 나타내는 것일까?

상관관계를 분석하는 것들은 어떤 것들의 사이가 밀접하다는 것만을 나타내며 그 관계는 어느 것이 원인이고 어느 것이 결과인지는 아무런 증거도 제공하지 않는다.

문제는 상관관계를 제대로 이해하지 못하는 사람들이 종종 상관관계가 인과관계를 나타낸다고 가정하는 데 있다.

즉 상관이 있으면 그 중의 하나가 원인이 되고 다른 것은 그 원인으로 인해서 생기는 결과라고 해석하는 잘못을 범하는 것이다.

두 개의 변수들은 상관관계를 갖지만 그것은 우연일 뿐 서로 인과관계가 없는 경우가 많다.

또한 인과관계가 있더라도 다른 변수들이 그 사이에 존재할 수도 있다.

인과관계는 매우 복잡한 개념으로 학자들의 견해도 다양하게 변화되어 왔다.

그 중에서도 철학자인 밀(John S Mill)은 인과관계가 성립할 수 있는 조건으로 다음의 세 가지를 제시하였다(Cook,Thomas D.and Donald T.Campbell,Quasi-Experimentation,Boston:Houghton Mifflin Co.1979,18쪽).첫째 원인은 결과보다 시간적으로 앞서야 하고,둘째로 원인과 결과는 관련이 있어야 하며 셋째 결과는 원인이 되는 변수만으로 설명이 되어야 하고 다른 변수에 의한 설명은 제거돼야 한다는 것이다.

그러나 많은 경우에 사람들은 이 중에서 한 가지 조건만 만족되어도 인과관계를 가정한다.

작은 언덕과 작은 언덕,그리고 낮은 산과 낮은 산들을 앞에 주욱 거느린 채 그 세모꼴의 머리로 하늘을 떠받치고 선 건지산은 언제 보아도 모습이 의젓했다.

…밤이면 어른들이 거기 모여 불장난을 한다.

어떤 때는 훤한 대낮에도 산봉우리에서 모개모개 연기가 피어오르는 걸 볼 수 있다.

…봉홧불과 무수한 살상과의 상관관계를 나는 미처 깨닫지 못했다.

왜 건지산에서 불길이 오르고 난 다음이면 꼭 읍내에서 시가전이 벌어지고 꼭 어느 고을 어떤 동네가 쑥대밭이 되어야만 하는가를 이해할 수가 없었다.

(윤홍길,'장마' 중에서)

그러나 이러한 조건들이 만족되었다는 것은 인과관계를 추론하는 데 있어서 합리적인 근거가 될 수는 있지만 인과관계의 존재가 입증되었다고는 할 수 없다.

다른 데이터로부터 축적된 유사한 결과와 연구자의 경험적인 판단이 인과관계를 확인하는 데 추가적으로 중요한 역할을 차지한다.

김진호 교수 jhkim@kndu.ac.kr

[ 약력 ]

△서울대 경영대 졸업

△미국 펜실베이니아대 와튼스쿨 경영학 석·박사

△(전)KBS 선거예측조사 자문위원

△(현)국방대 경영학과 교수