본문 바로가기
  • 과학과 놀자

    데이터 분석해보면 일어날 일 예측할 수 있어

    아날로그 온도계 2개로 동시에 온도를 측정해보면 온도계 사이에 미세한 눈금 차이가 존재함을 알 수 있다. 온도계를 아무리 잘 만들어도 소수점 이하의 모든 자릿수까지 일치하는 값을 나타낼 순 없다. 디지털 온도계는 차이가 생기기 시작하는 자릿수 이하의 값을 아예 표시하지 않거나 0으로 표시한다.따라서 여러 개의 디지털 온도계가 모두 37.5℃를 가리키더라도 엄밀히 말해 다 같은 온도는 아니다. 따라서 측정 기계가 가진 한계를 넘어 보다 정밀한 값을 알고 싶다면 여러 번 측정해 얻은 값이나 여러 측정기가 동시에 측정한 값을 논리적으로 분석하는 과정이 필요하다. 사람의 눈으로 직접 관찰하는 경우에도 비슷한 문제가 있기는 매한가지다. 특정 종류의 새가 언제 알을 낳는지는 한 마리를 관찰했다고 자신있게 말할 수 있는 것이 아니다. 그렇다고 모든 새를 관찰하는 것도 현실적으로 불가능하다. 따라서 사람의 감각기관으로 직접 관찰하는 경우에도 여러 개의 관찰 결과로 전체 양상을 추정하는 과정이 필요하다.이미 측정한 몇 개의 데이터로 아직 측정하지 않은 경우의 데이터를 예측하는 데는 확률이 사용된다. 대기권 밖의 단면적 A인 측정장치가 우주 먼 곳에서 폭발한 항성에서 방출된 입자 n개를 검출했다고 하자. 지구 반지름을 R이라고 할 때 지구의 전체 단면적 πR²에 동일한 확률로 입자가 도착할 것이라는 가정하에 지구 전체에 입사된 입자의 개수 N을 계산할 수 있다. 비례식에 의하면 n:N=A: πR²이므로 N=n(πR²/A)이다. 이같이 관찰하지 않은 값을 추정하기 위해 일정 범위 내에서 확률이 일정하다고 가정하는 것을 확률의 균등분포라고 한다. 확률의 균등분포를 사용