(91) 기댓값에 대한 이해
통계학에서 제1종 오류란 올바른 가설이 기각되는 것이고, 제2종 오류란 잘못된 가설이 받아들여지는 것을 말한다. (중략) 법은 사고 방지를 위한 적정 주의를 1수준으로 정하고 있으며 법원은 제1종 오류와 제2종 오류를 각각 20%의 확률로 범할 수 있는데, 이러한 것을 가해자도 알고 있다고 하자. 이 경우 가해자는 어느 수준의 주의를 선택할까?80% 확률로 기대 사고 비용 60원을 부담하게 되므로 총 기대 손실 비용은 이 둘을 곱한 값인 48원‘기대 A’라는 말을 많이 보게 된다. 이는 수학에서의 ‘기댓값’이라는 개념을 적용한 개념이다. 기댓값은 어떤 사건이 일어날 때 얻어지는 변수와 그 사건이 일어날 확률을 곱한 값을 말한다. 따라서 ‘기대 A’는 사건 A의 값에 A가 일어날 확률을 곱해 얻어진다.
가해자가 0수준의 주의를 선택하면 가해자는 80% 확률로 기대 사고 비용 60원을 부담하게 되므로 총 기대 손실 비용은 이 둘을 곱한 값인 48원이다. 가해자가 주의를 1수준으로 높이면, 추가적으로 주의 비용 30원이 들지만, 기대 사고 비용 20원을 부담할 확률이 20%에 불과하므로 4원만 부담하면 된다. 그러므로 총 기대 손실 비용은 34원이다. 2수준의 주의의 경우, 주의 비용 60원에 20% 확률로 기대 사고 비용 10원을 부담하게 되므로 총 기대 손실 비용은 62원이다.
-2022학년도 10월 교육청 전국연합학력평가-
지문에서 ‘기대 사고 비용’이라고 했다. ‘사고 비용’의 값에 사고가 일어날 확률을 곱한 것이다. 이를 이해하면 지문에 직접 언급되어 있지 않지만, ‘60’ ‘20’ ‘10’이라는 값은 각각 ‘6×10’ ‘2×10’ ‘1×10’이라는 계산을 통해 나온 것임을 알 수 있다. 즉 ‘사고 확률’이 각각 ‘6’ ‘2’ ‘1’이니 ‘사고 비용’은 10원이고 ‘기대 사고 비용’은 각각 ‘60’ ‘20’ ‘10’이다.
사실 이 설명은 굳이 할 필요가 없다. 왜냐하면 지문에서 중요한 것은 기대 사고 비용이 아니라 ‘총 기대 손실 비용’이기 때문이다. 다만 기댓값을 설명할 필요가 있어 기대 사고 비용을 계산하는 방법을 추리해 봤다.
표에는 총 기대 손실 비용의 값이 없다. 그리고 지문에 ‘80% 확률로 기대 사고 비용 60원을 부담하게 되므로 총 기대 손실 비용은 이 둘을 곱한 값인 48원’이라고 했다. 총 기대 손실 비용이 무엇인지는 모르겠지만 일어날 확률(80%)에 표에 있는 기대 사고 비용(60원)을 곱해서 구해지는 것이라고 한다. 확률에 의해 결정되는 기대 사고 비용이 또다시 확률에 의해 결정되는 총 기대 손실 비용에 영향을 미친다는 것을 알 수 있다.
“철수 쌤! 왜 수학을 하세요?”
안타깝게도 이는 틀린 질문이다. 철수 쌤은 국어를 한 것이다. 고등학교 1학년 때까지 배운 수학 개념은 국어 능력이라고 누누이 강조한 바 있다. 기댓값은 중학교 때 배우는 것이다. 따라서 국어를 하려면 기댓값은 알고 있어야 한다. 80% 확률… 확률이 20%… 20% 확률로철수 쌤도 이 지문을 접하고 적잖이 당황했다. 갑자기 80처럼 계산했고, 20, 20이라는 수가 튀어나왔기 때문이다. 수학적 연산과 관련한 국어 능력을 발휘해야 했다.
먼저 각각의 수는 ‘제1종 오류와 제2종 오류를 각각 20%의 확률로 범할 수 있’다는 것과 관련 있으리라 생각했다. 80은 어떤 한 오류를 범하지 않은 경우로 ‘100-20=80’처럼 계산했고, 20은 각각 어떤 오류를 범한 경우로 생각했다. 이제 어떤 오류인가를 정하는 것이 문제가 되었다.
철수 쌤은 지문의 앞부분에서 그린 판정도를 변형해 다음과 같이 그렸다. 즉 ‘적정 주의를 1수준으로 정’했는데 ‘0수준의 주의를 선택’하면 ‘적정 주의 수준을 지키지 않았다’는 가설은 올바른 가설이 된다. 그 가설이 기각되는 제1종 오류는 20%고, 기각되지 않아 오류를 범하지 않는 경우는 80%다. 철수 쌤은 이렇게 생각하면서 80%를 추론할 수 있었다. 그런 식으로 ‘주의를 1수준으로 높’였을 때 20%를 추론해봤다. 이 경우 적정 주의 수준을 지키지 않았다는 가설은 올바르지 않은 것이 되고, 그것이 기각되지 않았을 때, 즉 제2종 오류를 범했을 때다.
“판정도를 그려 놓으니까 이렇게 편리하군!”
철수 쌤은 신나서 ‘2수준의 주의의 경우’를 위와 같이 판단해 보았다. 그런데 갑자기 공황 상태에 빠졌다. 이 경우 0수준의 주의를 선택한 경우와 같이 80%여야 하는데, 지문에 20%라 했기 때문이다. 그러나 철수 쌤에겐 상황에 따라 글을 읽는 임기응변이 있다. 지문의 20%일 경우를 다시 살펴본다. 2수준의 주의의 경우 20%일 때는, 올바른 가설이면서 제1종 오류를 범했을 때나, 주의를 1수준으로 했을 경우 제2종 오류를 범했을 때와 같을 때다. 그러다 문득
“2수준? 그것은 1수준보다 주의를 더 기울인 경우인데?” 하는 생각이 들었다. 다시 말해 법이 정한 수준보다 더 철저하게 주의를 한 것이다. 그렇다면 2수준은 1수준과 같은 경우로 봐야 하지 않나 하는 생각에 이르렀다.
물론 이 생각이 맞는지 안 맞는지는 모르겠으나, 맞을 확률은 높다. 왜냐하면 논리적으로 아무 문제가 없기 때문이다. 철수 쌤은 글을 이렇게 읽는다. 확실한 이해가 아니면 확률 높은 이해를 하는 것이다. 포인트 1. 기댓값은 어떤 사건이 일어날 때 얻어지는 변수와 그 사건이 일어날 확률을 곱한 값이다.
2. 기댓값은 중학교 때 배우는 것으로, 기댓값을 알고 있어야 읽을 수 있는 글이 있다.
3. 수학적 연산과 관련한 국어 능력을 발휘하며 읽어야 하는 글이 있다.
4. 판정도를 통해 다양한 경우의 수를 일목요연하게 볼 수 있도록 하자.
5. 확실한 이해가 아니면 논리적으로 따져 확률 높은 이해를 해야 한다.