본문 바로가기
  • 학습 길잡이 기타

    정확한 예측 위해서는 표본 선정을 잘 해야

    2024년 4월 10일, 제22대 국회의원 선거가 실시됩니다. 선거일 현재 18세 이상의 국민이 선거권을 지닌 만큼 고등학생 중 일부 학생은 이번에 첫 투표를 하게 될 것입니다. 선거일이 다가올수록 TV나 신문 등 언론매체에서 각종 여론조사 결과를 발표하고 있습니다. 이 여론조사 결과를 보면 사회집단 구성원 속 여론의 동향을 알아볼 수 있기 때문에 정치인이나 유권자가 서로를 이해하는 데 도움을 줍니다. 그런데 여론조사에서는 전체 구성원의 의견을 묻는 것이 아닌 일부만 뽑아서 표본조사를 합니다. 이에 대해 한번 알아봅시다.통계조사에서 조사 대상이 되는 집단 전체를 조사하는 것을 ‘전수조사’라고 합니다. 그런데 전수조사는 많은 시간과 비용이 필요할 뿐 아니라 전수조사 자체가 불가능한 경우도 있습니다. 이 때문에 조사 대상이 되는 집단 전체에서 일부분만 뽑아 조사하는 표본조사를 실시합니다.표본조사에서 조사 대상이 되는 집단 전체를 ‘모집단’이라 하고, 모집단에서 뽑은 일부분을 ‘표본’이라고 합니다. 또 모집단에서 표본을 뽑는 것을 ‘추출’이라고 합니다.표본조사의 목적은 표본에서 얻은 정보를 바탕으로 모집단의 특성을 추측하는 데 있습니다. 따라서 모집단의 특성이 잘 반영되도록 표본을 택하는 것이 중요합니다. 이를 위해서는 추출되는 표본이 모집단의 어느 한 부분에 편중되지 않아야 한다. 표본추출이 잘못된 한 가지 사례를 소개합니다.미국에서는 오래전부터 선거 여론조사를 통해 선거 결과를 예측해 보도했습니다. 미국의 대중 잡지 <리터러리 다이제스트>는 전화번호부와 자동차 등록부를 이용해 선정된 조사 응답자를 대상으

  • 경제 기타

    통계와 놀아볼까

    초·중학생용 경제·논술신문 ‘주니어 생글생글’의 이번 주 커버스토리 주제는 통계입니다. ‘우리 가족의 몸무게 변화’ ‘집안일에 따른 용돈 체계’ 등 주변에서 쉽게 만날 수 있는 숫자들을 정리하면 그것 자체로 통계가 된다는 점을 설명해 친숙하게 받아들이도록 했습니다. 주니어 생글생글 기자들도 주변에서 통계로 작성할 만한 사례를 찾아 기사로 보내왔습니다.추석 연휴로 생글생글 9월 12일자는 쉽니다.

  • 커버스토리

    남녀 인구, 소와 말의 숫자 기록…통일신라때도 통계 작성

    통계(統計)를 뜻하는 영단어 Statistics는 확률 또는 상태를 의미하는 라틴어 Statistcus와 Statisticum, 혹은 나라를 의미하는 이탈리아어 Statista에서 유래했다는 이야기가 있습니다. 어원부터 국가의 운영과 관련이 있다는 것을 짐작할 수 있죠. 수천 년 전부터 국가는 세금을 걷기 위해 인구조사를 했을 것입니다. 현존하는 우리의 가장 오래된 기록인 통일신라시대의 민정문서를 보면 조세와 노동력 파악을 위해 서원경(지금의 청주지역) 4개 촌락의 노비를 포함한 남녀 인구수, 소·말의 숫자, 뽕나무 그루수 등이 자세히 적혀 있다고 합니다. 1239건의 국가승인통계오늘날에도 통계는 현상에 대한 이해와 국가 간 비교 등을 위해 국가 등 공신력 있는 곳에서 작성하고 있습니다. 우리의 경우 6월 현재 정부와 지방자치단체, 금융기관, 공기업, 각종 협회 등 427개 기관에서 1239건의 각종 ‘국가승인통계’를 작성해 발표하고 있습니다. 가장 큰 인구주택총조사통계는 5년마다 발표됩니다. 국가통계포털에 들어가면 각종 통계자료를 다 볼 수 있어요.공공부문 이외에 민간에서도 필요에 따라 통계를 작성합니다. 예컨대 제빵업체에서는 날씨 통계와 제품 판매량을 토대로 27도 이상의 맑은 날씨에는 샌드위치가 가장 잘 팔리고, 비가 오는 20도 안팎 날씨에는 소시지빵 등 고명을 올린 조리빵이 잘 팔린다는 등 분석을 해서 생산계획에 반영한다네요.통계는 수량적 자료들을 있는 그대로 다 모으는 기술통계와 모집단에서 일부 표본을 추출해 조사한 뒤 모집단 전체의 특성을 추정하는 추리통계로 나뉘기도 하고 조사시기에 따라 월이하, 분기, 반기, 연간, 1년 이상으로 세분하거나 작성방법에 따라 각종 수

  • 커버스토리

    통계, 숫자에 담긴 함정을 피하려면…

    홍남기 부총리 겸 기획재정부 장관은 지난달 20일 “1분기 소득 분배 상황이 크게 개선돼 코로나19 이전보다 크게 나아졌다”고 발표했습니다. 통계청이 매 분기 발표하는 가계동향조사에서 소득 불평등 정도를 가늠하는 ‘5분위 배율’이 좋아졌다는 근거에서입니다. 소득 상위 20%의 평균 소득을 하위 20%의 평균 소득으로 나눈 5분위 배율은 수치가 높을수록 불평등이 악화하고 낮을수록 완화했음을 의미합니다.올해 1분기 5분위 배율은 6.30배인데 올해 처음으로 1인 가구를 포함해 계산한 수치입니다. 지난해까지는 2인 이상 가구만 대상으로 조사했는데, 1인 가구까지 포함했다고 가정하면 지난해 1분기 6.89배에서 올해 수치가 낮아졌다는 논리입니다. 하지만 지난해 1분기 공식 발표된 5분위 배율은 5.41배입니다. 공식 발표 수치만 비교해 보면 불평등이 악화한 것이죠. 정치권과 야당에서는 정부에서 불평등 정도가 개선됐다고 홍보하기 위해 2인 가구 이상에서 1인 가구 포함까지 기준을 달리 해 통계를 왜곡했다고 비판하고 있습니다.통계는 자연·사회 현상을 숫자로 계량화한 정보입니다. 통계를 내는 것은 시간과 공간 등 여러 기준에 따른 비교와 대조를 통해 자연·사회 현상을 정확히 이해하기 위해서입니다. 또 통계상으로 나타나는 흐름을 토대로 미래를 예측하거나, 표본조사를 통해 전체적인 윤곽을 그리기도 합니다. 그러한 이해를 바탕으로 정책을 펴거나 새로운 제도를 도입해 우리 사회를 더 나은 방향으로 이끌어가려는 것입니다. 실제로 ‘백의의 천사’로 알려진 나이팅게일은 1853년 크림전쟁 당시 야전병원의 입원, 부상, 사망원인 등에 관한 내역을 통계로 작

  • 커버스토리

    100% 늘어난 상어 공격?…실제론 2→4건으로 증가

    통계는 숫자로 표현된 과거입니다. 미래에 대한 통계가 있을 수 없는 이유죠. 통계가 중요한 이유는 통계를 통해 과거의 패턴을 살펴보고 모형화해서 미래를 짐작해볼 수 있기 때문입니다. 통계는 있는 그대로 산출돼야 합니다. 예를 들어 당국이 경제성장률이나 실업률 통계를 낼 때 관련된 숫자를 편의에 따라 부풀리거나 줄인다면, 우리는 그 통계를 믿지 못합니다. 잘못된 통계는 잘못된 해결책을 내게 되고 결국, 통계 하나가 국가의 자원을 불필요하게 소모하게 만들고 맙니다.우리가 각종 통계를 정확하게 보기 위해선 기본적인 식견이 있어야 합니다. 통계를 제대로 보는 데 방해를 일으키는 요소는 많습니다. 편견은 대표적인 장애물입니다. 편견을 가지면 보고 싶은 것만 보고 자기가 옳다고 생각하는 것만 믿는 확증편향에 빠집니다. 잘못된 지식과 정보도 통계를 잘못 읽게 합니다. 퍼센트(%)와 퍼센트포인트(%p)를 구분하지 못하면 오류에 빠집니다. 책 두 권을 소개하겠습니다. 《통계의 함정》이라는 책과 《팩트풀니스》입니다. 여름 방학 때 사서 꼭 읽어보세요.통계를 볼 때 절대치와 상대치를 제대로 구분할 줄 알아야 합니다. 예를 들어 5년 전보다 바다 상어 공격 피해가 두 배 증가했다는 통계 기사가 있다고 칩시다. 여러분은 아마 바다에서 수영하기 싫을 겁니다. 두 배는 위험의 상대수치입니다. 실상은 2건에서 4건으로 늘어난 것인데, 과장을 좋아하는 언론은 두 배 늘었다고 표현합니다. 5년간 겨우 2건이 늘었을 뿐이죠.이런 절대치와 상대치 바꿔치기는 의외로 많이 나옵니다. 관심을 끌려 할 때 이런 수법이 동원됩니다. 바다로 놀러 가는 수많은 사람 중 사고가 4건밖에 발생하지 않았

  • 시사 이슈 찬반토론

    통계를 왜곡하면 상황 판단과 예측이 모두 어긋나죠

    [사설] 무리한 정책 짜맞추려는 통계 오독·왜곡, 심한 것 아닌가 통계는 국가 사회의 중요한 ‘인프라 자산’이다. 정확하고 독립적인 통계 자료를 위해 청(廳) 단위 정부기관을 두고 전문성을 강화하는 것도 그래서다. 기업과 개인도 신뢰할 수 있는 통계를 제대로 읽을 때 보다 나은 미래를 기약할 수 있다. 그래도 통계를 더 냉철하게 다뤄야 할 곳은 정부다. 애초 잘못됐거나 오독(誤讀)한 통계를 바탕으로 한 정책은 끔찍한 결과를 초래할 수 있다.근래 정부가 논란 많은 정책들을 밀어붙이면서 과연 정확한 통계에 기반했느냐 하는 의구심을 낳게 하는 사례가 늘고 있다. 짜맞추기로 왜곡하거나 억지로 해석하는 경우도 없지 않다. 종합부동산세 인상안 발표 때 나온 “한국은 보유세가 낮다”는 재정개혁특별위원회 주장이 그런 예다. 특위는 “경제협력개발기구(OECD) 국가의 국내총생산(GDP) 대비 보유세 비중은 평균 1.1%인데 한국은 0.8%”라고 강조했다. 하지만 전체 세수(稅收) 비중으로 보면 3.2%(2015년 )로, OECD 평균(3.3%)과 비슷하다. 더구나 보유세와 함께 묶이는 거래세의 세수 비중은 3.0%로, OECD 평균(0.4%)의 7.5배에 달한다는 사실이 무시됐다.전력판매 손실비가 1조2000억원에 이른다는 월성원전 1호기 조기폐쇄 결정 논리도 문제다. 7000억원을 들여 2022년까지 수명을 연장한 원전을 이런저런 핑계로 가동 중단시키고는 ‘낮은 가동률로 경제성이 떨어진다’고 주장했다. ‘맞춤형 통계’의 논란은 “최저임금 인상의 긍정적 효과가 90%”라는 대통령 발언 때도 불거졌다. 임금 급등에 따른 실직자들은 빼버린 ‘편집 통계’가 근거가 됐다.그러면서도 다수

  • 커버스토리

    통계 왜곡 · 엉터리 해석이 비관론 부추겨요 !

    ‘0.4%.’ 한국은행이 발표한 지난해 4분기 성장률(전 분기 대비)이다. 이를 놓고 세간에는 “경제가 곤두박질친다”는 식의 부정적 해석이 쏟아졌다. 성장률이 전 분기(0.6%)보다 떨어졌고, 다섯 분기 연속 0%대라는 이유에서다. 하지만 4분기 경제지표에 긍정적 신호가 많다는 반론 또한 팽팽했다. 설비투자가 6.3% 늘어 2012년 1분기 이후 최고치였고, 제조업 생산은 1.8% 증가해 전 분기의 부진(-0.9%)을 벗어났다. 당초 마이너스 성장 전망마저 무성했던 점을 감안하면 “선방한 것 아니냐”는 주장이다.유명한 통계지표는 완벽할 것이라는 오해물이 절반 채워진 컵을 보고 어떤 사람은 “반밖에 안 남았다”고 하고, 어떤 사람은 “반이나 차 있다”고 한다. 경제를 둘러싼 낙관론과 비관론도 비슷하다. 경기지표에는 긍정적·부정적인 것이 혼재돼 있기 마련이다. 경제를 분석할 때 선입견과 편견을 버리고 여러 지표를 종합적으로 검토하는 능력이 중요한 이유다.소비지표로 가장 많이 인용되는 것으로 백화점·대형마트 매출이 있다. 지난해 12월 백화점과 마트의 매출 증가율(전년 동기 대비)은 3.8%, 0.7%. 이것만 보면 소비는 부진하다. 하지만 1인 가구가 많이 찾는 편의점이나 온라인·모바일 쇼핑몰 매출은 10~30%대 고성장을 이어가고 있다. 온·오프라인을 합쳐 보면 밑바닥 경기에 대해 다른 해석이 가능해지는 것이다. 실제로 유통업계에선 “소비 패턴 변화에 맞춰 지표 분석도 달라져야 한다”는 지적이 나온다.사람들의 경제생활 방식은 계속 바뀌는데 구닥다리 통계지표가 이를 따라가지 못하는 일이 심심찮게 일어난다. 한 나라의 경제 규모를 보여주