자료의 요약과 표현 ①
수집한 자료는 자료의 종류에 따라 그에 맞는 적절한 그래프를 선택해서 나타내야 자료의 분포 상태를 파악하기 쉽습니다. 자료의 특성에 따라 목적에 맞는 적절한 그래프를 선택하는 방법을 알아봅시다.
통계청의 통계인재개발원에서 개최한 제27회 전국학생통계활용대회(www.통계활용대회.kr)가 진행되고 있습니다. 이 대회는 학생들이 자료 수집과 분석 등을 직접 수행해 통계 포스터를 작성해봄으로써 문제해결 능력과 통계적 사고력을 기르도록 하는 데 목적이 있습니다. 통계 포스터뿐 아니라 실생활의 문제 상황을 통계를 이용해 해결할 때에는 주제 정하기, 자료 수집하기, 자료 정리 및 분석하기, 결과 해석하기의 통계적 문제 해결 4단계 과정을 따르게 됩니다. 이 중 자료 정리 및 분석하기 단계에서는 수집된 자료를 자료의 특성과 자료 정리의 목적에 맞는 적절한 그래프를 선택하는 것이 중요하기 때문에 이에 관한 내용을 몇 회에 걸쳐 이야기해보려고 합니다.수집한 자료는 자료의 종류에 따라 그에 맞는 적절한 그래프를 선택해서 나타내야 자료의 분포 상태를 파악하기 쉽습니다. 자료의 특성에 따라 목적에 맞는 적절한 그래프를 선택하는 방법을 알아봅시다.
학교에서 배워 알고 있는 통계 그래프는 막대그래프, 꺾은선그래프, 원그래프, 띠그래프, 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형, 상자 그림 등으로 다양합니다. 자료를 수집하고, 그 자료로 통계 그래프를 그릴 때는 보통 이 그래프 중 1개를 선택해 그립니다. 이때 자료의 특성에 맞는 적절한 그래프를 어떻게 선택해야 할까요?
한 고등학교의 학급 학생들을 대상으로 시행한 설문조사에서 고등학교 학생들의 이성 교제와 관련해 다음과 같은 질문을 했습니다.
가장 오래 사귀어 본 것은 며칠인가요?
( )일
학생들은 이 질문에 아래와 같이 답변했고, 그 자료를 [그림1]과 같이 막대그래프로 나타냈다고 합시다.
![[재미있는 수학] 수치형 자료는 히스토그램, 범주형은 막대 그래프](https://img.hankyung.com/photo/202507/AA.41087605.1.jpg)
![[재미있는 수학] 수치형 자료는 히스토그램, 범주형은 막대 그래프](https://img.hankyung.com/photo/202507/AA.41087601.1.jpg)
이를 알아보기 쉽게 바꾸려면 사귄 날수의 범위를 나누어 생각해보면 됩니다. 사귄 날수를 0일 이상 100일 미만, 100일 이상 200일 미만, …으로 정리해 직사각형으로 표현하면 [그림2]와 같이 나타낼 수 있고, 이 그래프는 사귄 날수의 분포를 훨씬 알아보기 쉽습니다. [그림2]와 같은 그래프를 ‘히스토그램’이라고 합니다.
![[재미있는 수학] 수치형 자료는 히스토그램, 범주형은 막대 그래프](https://img.hankyung.com/photo/202507/AA.41087603.1.jpg)
![[재미있는 수학] 수치형 자료는 히스토그램, 범주형은 막대 그래프](https://img.hankyung.com/photo/202507/01.41091161.1.png)
학생들이 통계 포스터나 보고서 등을 만들 때, 설문조사 결과로 표나 그래프를 나타내다 보면 막대그래프나 원그래프와 같은 범주형 자료로만 그래프가 구성되는 경우가 많습니다. 이는 학생들이 만든 설문조사의 문항이 보통 객관식 문항으로만 나타나는데, 객관식 문항에 응답한 자료는 범주형 자료이기 때문입니다. 수치형 자료를 통계 포스터나 보고서에 표현하고 싶을 때는 설문조사 문항 중 숫자로 답할 수 있는 주관식 문항을 만들면 됩니다. 예를 들어 앞의 문항인 ‘가장 오래 사귀어본 것은 며칠인가요?’에 ‘① 0일 이상 10일 미만, ② 10일 이상 50일 미만, …’과 같은 선지를 두면 범주형 자료가 나오기 때문에 ‘( )일’과 같이 숫자로 답할 수 있는 주관식 문항을 만들면 수치형 자료를 나타내는 그래프를 선택할 수 있습니다. 이때 주의할 점은 다양한 그래프를 나타내려고 설문 문항을 목적에 맞지 않게 억지로 바꾸면 안 된다는 점입니다.
