마트 영수증을 봤는데 1,200원, 12,900원, 19,800원 같은 숫자가 유독 많이 보인 적 있나요? 아니면 뉴스에서 예산, 인구, 매출 숫자를 볼 때 이상하게 1로 시작하는 숫자가 자주 보인다든가요.
처음엔 그냥 기분 탓 같아요. 숫자는 1부터 9까지 있으니까 첫자리가 1일 확률도 당연히 9분의 1, 그러니까 약 11.1%일 것 같잖아요?
그런데 현실의 많은 숫자표에서는 전혀 아니에요. 첫자리가 1일 확률은 약 30.1%, 9일 확률은 약 4.6%로 나타나는 경우가 많아요. 이 묘한 규칙이 바로 벤포드 법칙이에요.
숫자는 공평하게 굴러가는 주사위가 아니라, 생각보다 1번 칸에 오래 머무는 엘리베이터에 가까워요.
🛒 가격표가 1층에 오래 머무는 느낌이에요
가령 어떤 상품 가격이 1,000원에서 9,999원까지 커진다고 해볼게요. 첫자리가 1인 구간은 1,000~1,999원이에요. 2도 2,000~2,999원이고, 9도 9,000~9,999원이죠.
“어? 그럼 다 똑같은 폭 아닌가?” 싶죠. 맞아요. 일반 눈금으로 보면 같아요.
그런데 벤포드 법칙은 숫자를 로그 눈금으로 봐요. 이게 살짝 어려운 포인트예요. 로그 눈금은 숫자를 “얼마나 더했나”보다 “몇 배로 커졌나”에 더 민감하게 보는 눈금이에요.
예를 들어 1에서 2로 가는 건 2배예요. 그런데 9에서 10으로 가는 건 약 1.11배밖에 안 돼요. 숫자가 커질수록 같은 1칸 이동이 점점 덜 커 보이는 거죠.
| 첫자리 | 벤포드 법칙상 비율 |
|---|---|
| 1 | 약 30.1% |
| 2 | 약 17.6% |
| 3 | 약 12.5% |
| 9 | 약 4.6% |
수식으로는 이렇게 써요.
여기서 는 첫자리 숫자예요. 그러니까 첫자리가 1일 확률은 , 대략 30.1%가 돼요. 수식은 딱딱하지만 뜻은 간단해요. 1로 시작하는 구간이 로그 세계에서는 제일 넓다는 말이에요.
📖 이 법칙은 낡은 로그표에서 시작됐어요
재밌는 건 이 법칙이 컴퓨터 시대에 발견된 게 아니라는 점이에요. 1881년 천문학자 사이먼 뉴컴은 로그표 책을 보다가 이상한 점을 발견했어요. 앞쪽 페이지, 그러니까 1로 시작하는 숫자가 있는 페이지가 더 닳아 있었던 거예요.
사람들이 1로 시작하는 숫자를 더 자주 찾아본다는 뜻이었죠.
이후 1938년 물리학자 프랭크 벤포드가 더 크게 확인했어요. 강의 면적, 인구, 물리 상수, 주소, 신문 숫자 같은 여러 자료에서 총 20,229개의 첫자리를 세어봤고, 평균적으로 1이 약 30.6%, 9가 약 4.7% 나오는 흐름을 정리했어요.
신기하죠? 일부러 숫자를 고른 게 아니라, 서로 상관없어 보이는 자료를 모았는데도 비슷한 패턴이 나온 거예요.
🧾 그래서 회계 장부도 숫자로 수상함을 봐요
벤포드 법칙이 유명해진 이유는 “숫자 잡학”으로 끝나지 않기 때문이에요. 회계 감사나 데이터 검토에서 이상 신호를 찾는 도구로 쓰일 수 있어요.
사람이 숫자를 조작할 때는 무의식적으로 “그럴듯한 숫자”를 만들려고 해요. 예를 들어 77,800원, 84,300원, 92,100원처럼 큰 첫자리를 과하게 만들 수도 있죠. 그런데 실제 매출, 비용, 인구처럼 자연스럽게 커지고 작아지는 숫자는 첫자리 분포가 벤포드 법칙에 가까운 경우가 많아요.
다만 여기서 오해하면 안 돼요.
💡 벤포드 법칙은 “범인 찾는 탐정”이 아니라 “여기 좀 이상한데?” 하고 손전등을 비추는 도구예요.
어떤 장부가 벤포드 법칙과 다르다고 바로 조작은 아니에요. 상품 가격이 전부 9,900원 근처라든가, 보험 청구액이 50~100달러 사이로 제한돼 있다든가, 전화번호처럼 애초에 사람이 배정한 숫자라면 벤포드 법칙이 잘 맞지 않아요.
🔍 잘 맞는 숫자와 안 맞는 숫자가 따로 있어요
벤포드 법칙은 아무 숫자에나 붙이면 곤란해요. 특히 숫자가 여러 자릿수 범위를 넓게 오갈 때 잘 맞아요. 인구, 기업 매출, 강 길이, 도시 면적처럼 10, 100, 1,000, 10,000 단위를 넘나드는 자료가 대표적이에요.
반대로 사람 키는 잘 안 맞아요. 한국 성인 키가 10cm부터 900cm까지 널뛰기하지 않잖아요. 대부분 150~190cm 근처에 몰려 있어요. 첫자리가 거의 1로 시작하니 벤포드 법칙을 적용할 수 없죠.
간단히 나누면 이래요.
- 잘 맞는 쪽: 인구, 매출, 자연 측정값, 넓은 범위의 비용 자료
- 잘 안 맞는 쪽: 키, 몸무게, 전화번호, 우편번호, 정해진 가격표
- 조심해서 볼 쪽: 표본이 너무 적거나 특정 기준으로 걸러낸 자료
결국 핵심은 이거예요. 숫자가 자연스럽게 여러 크기를 오가면 첫자리가 1인 숫자를 더 자주 만나게 돼요. 숫자의 세계에도 은근히 “자주 나오는 입구”가 있는 셈이죠.
✅ 한 줄로 정리하면요
벤포드 법칙은 현실의 많은 숫자에서 첫자리가 1일 확률이 9분의 1이 아니라 약 30%에 가깝게 나타나는 현상이에요. 이유는 숫자를 더하기 눈금이 아니라 배수, 즉 로그 눈금으로 보면 1로 시작하는 구간이 가장 넓기 때문이에요.
다음에 뉴스에서 예산 숫자나 기업 매출표를 보면 첫자리만 슬쩍 세어봐요. 갑자기 숫자들이 조금 덜 무표정해 보일 거예요. 꽤 재밌어요 👋
📚 참고 자료
- Wolfram MathWorld, “Benford’s Law”
- Frank Benford, “The Law of Anomalous Numbers”, Proceedings of the American Philosophical Society, 1938
- ISACA Journal, “Understanding and Applying Benford’s Law”, 2011
댓글
아직 댓글이 없어요