벤포드 법칙

벤포드 법칙은 우리에게 중요한 교훈을 줍니다. 수학은 단순히 공식을 암기하는 도구가 아니라, 세상 속 숨은 질서를 찾아내는 언어라는 사실입니다. 우리가 흔히 지나치는 숫자의 첫 자리에서조차 수학적 구조가 드러나고, 그것이 사회적 정의를 세우는 수단으로까지 확장될 수 있다는 점은 놀라운 일입니다.
 Getty Images Bank
Getty Images Bank
우리가 일상에서 만나는 숫자들을 떠올려봅시다. 인구수, 전기 사용량, 회사 매출액, 심지어 강의 길이까지. 이런 데이터들을 무작위로 모아놓으면, 1부터 9까지의 숫자가 첫 자리에 고르게 분포할 거라고 생각하기 쉽습니다. 그래서 만약 사람이 적당히 창작해서 만들어 넣으면 보통 처음 시작하는 수가 심하게 치우치지 않고 적당히 분산되어 있습니다. 하지만 놀랍게도 현실은 전혀 그렇지 않습니다. 자연스럽게 생성되고 측정된 수치들은 첫 자리가 1로 시작하는 경우가 압도적으로 많고, 그 뒤로 갈수록 줄어듭니다. 이 현상을 ‘벤포드 법칙’이라고 부릅니다.

이러한 경향은 AI의 도움을 받는다면 어렵지 않게 확인해볼 수 있습니다. 대중적인 AI 도구를 사용해 대륙별로 대표적인 국가 47개국의 인구 정보를 모아보았는데요, 그중 30%가량은 1로 시작합니다. 2로 시작하는 경우는 13% 정도네요. 7, 8, 9로 시작하는 경우는 겨우 5% 남짓에 불과합니다. 잠깐이면 되니 여러분도 시간을 내어 한번 해보기를 권합니다.

마치 자연은 1이라는 숫자를 특히 사랑하는 듯합니다. ‘자연스러운’ 수들은 각자가 나타날 확률이 n분의 1쯤 될 것 같지만, 우리의 직관과 달리 “작은 숫자가 첫 자리에 나타날 가능성이 훨씬 높다”는 이 불균형한 분포는 조금이라도 관심을 기울여본 사람들에게 신비로운 느낌을 줍니다.

이 이야기는 사실 19세기 말 한 천문학자의 호기심에서 시작됩니다. 캐나다 출신 천문학자 사이먼 뉴컴은 도서관에서 자주 쓰이는 로그표 책을 관찰하다 이상한 점을 발견했습니다. 책의 앞부분, 즉 1로 시작하는 구간은 손때가 많이 묻어 낡았지만, 9로 시작하는 뒷부분은 거의 새 책처럼 깨끗했습니다. 그는 사람들이 실제 계산에서 1로 시작하는 숫자를 훨씬 자주 다룬다는 것을 직감했고, 이를 짧은 논문으로 기록했습니다. 하지만 당시 이 발견은 큰 주목을 받지 못했습니다.

50년 뒤, 미국의 물리학자 프랭크 벤포드가 다시 이 현상에 주목합니다. 그는 단순한 추측에 그치지 않고, 인구 통계·강의 길이·원자량·전기 사용량 등 무려 2만 개가 넘는 수치를 모아 분석했습니다. 그리고 뉴컴이 지적한 경향이 단순한 우연이 아니라 일관된 패턴임을 입증했습니다. 이로써 벤포드 법칙은 세상에 널리 알려지게 되었지요.

겉보기에 벤포드 법칙은 단순한 우연처럼 보입니다. 하지만 조금만 생각해보면 쉽게 이해할 수 있습니다. 얼핏 보면 모든 숫자가 고르게 나타나야 맞을 것 같지만, 실제로는 앞자리 숫자가 머무르는 시간이 다르기 때문입니다. 예를 들어 어느 지역의 인구가 100명에서 200명으로 바뀌려면 두 배가 되어야 하므로 오랜 시간이 걸립니다. 그래서 앞자리 1은 꽤 오래 유지됩니다. 반대로 200명에서 300명으로 오를 때는 1.5배면 되니 시간이 덜 걸리고, 900명에서 1000명이 될 때는 1.1배만 오르면 되므로 금방 바뀝니다. 이 때문에 9로 시작하는 숫자는 금세 지나가 버리고, 1로 시작하는 숫자는 훨씬 오래 머무르게 됩니다. 이렇게 생각하면 벤포드 법칙은 그저 단순한 우연이 아니라 충분히 설명 가능한 현상임을 알 수 있습니다.

그래서 실제로는 인구수, 강의 길이, 기업의 매출액처럼 여러 규모가 섞여 있는 자료들이 벤포드 법칙에 잘 들어맞는 편입니다. 반면에 시험 점수 백분율처럼 0에서 100 사이로 제한된 값이나 사람이 인위적으로 만든 숫자 집합은 이 법칙에서 벗어나기 쉽습니다.

벤포드 법칙은 흥미로운 사실을 넘어, 실제 사회에서 강력한 도구로 쓰이고 있습니다. 회계와 세무 감사에서 사람이 장부를 조작하면 첫 자리 숫자가 고르게 분포하는 경향이 나타납니다. 하지만 자연 데이터는 1로 시작하는 수가 압도적으로 많습니다. 이 차이를 이용해 세금탈루나 회계 사기를 적발할 수 있습니다. 실제로 미국 국세청과 FBI는 벤포드 법칙을 조사 도구로 활용합니다. 범죄 수사와 법률 분야에서는 선거 조작 여부를 판별할 때 투표 수 데이터를 벤포드 법칙과 비교하기도 합니다. 물론 모든 경우에 절대적 기준은 아니지만, 수상한 패턴을 잡아내는 유용한 방법이 됩니다. 과학과 공학에서도 지진 규모, 천체 물리 데이터, 금융시장 지표 등에서 벤포드 분포가 발견됩니다. 이는 복잡한 자연현상 속에서도 어느 정도 미지의 영역에 대해 예측할 수 있는 확률적 근거를 줍니다.

이정현 푸른숲발도르프학교 교사
이정현 푸른숲발도르프학교 교사
우리가 숫자를 대할 때의 직관은 1부터 9가 고르게 나올 거라는 단순한 상상에 머뭅니다. 하지만 현실의 데이터는 우리의 예상을 깨고, 1이 훨씬 자주 나타나는 패턴을 보여줍니다. 이 괴리는 곧 통계적 착시이자, 수학이 직관을 넘어서는 이유입니다.