뉴스에서 "우리나라 가구 평균 자산이 5억이 넘었다"는 기사를 본 적 있을 거예요. 그런데 주변을 둘러봐도, 내 통장을 들여다봐도, 그 "평균"에 닿는 사람을 찾기가 쉽지 않아요. "내가 그렇게 못 사는 건가?" 싶어서 괜히 자존감만 깎이죠.
사실 그건 여러분 탓이 아니에요. 평균이라는 숫자가 거짓말을 하고 있는 것에 가까워요. 오늘은 우리가 너무 당연하게 믿어온 '평균'이 어떻게 우리를 속이는지, 같이 뜯어봐요.
🍺 빌 게이츠가 술집에 들어오면 생기는 일
유명한 비유가 하나 있어요. 연봉 3천만원인 사람 9명이 술집에서 맥주를 마시고 있다고 쳐봐요. 이 술집의 평균 연봉은 당연히 3천만원이에요.
그런데 갑자기 문이 열리고 빌 게이츠가 들어와요. 그의 연봉이 대략 1조원이라고 해볼게요. 이제 술집 안 10명의 평균 연봉은? 약 1,000억원이 돼요.
통계적으로 이 술집은 "평균 연봉 1,000억"의 엄청난 부자 집단이에요. 그런데 현실은? 9명은 여전히 3천만원을 받고, 1명만 압도적으로 많이 버는 곳이죠.
평균은 "모두를 대표하는 숫자"가 아니라, 극단값 한두 개에 쉽게 휘둘리는 숫자예요.
이게 바로 우리가 뉴스에서 보는 "평균 자산", "평균 연봉"에서 벌어지는 일이에요. 소수의 초고소득자가 전체 평균을 위로 끌어올리고 있어서, 대다수 사람의 실제 삶과는 동떨어진 숫자가 나와버려요.
📊 그래서 등장한 게 "중앙값"이에요
이 문제를 해결하려고 통계학자들이 쓰는 숫자가 바로 중앙값(median) 이에요. 이름은 어려워 보여도 개념은 단순해요.
사람들을 소득순으로 쭉 줄 세운 다음, 정확히 가운데 서 있는 사람의 값을 뽑는 거예요. 빌 게이츠가 들어와도, 일론 머스크가 들어와도, 줄의 가운데 사람은 바뀌지 않잖아요. 그래서 극단값에 훨씬 덜 흔들려요.
실제 한국 통계에서도 이 차이가 뚜렷해요. 2024년 가계금융복지조사에 따르면, 우리나라 가구의 평균 순자산은 약 4억 3,500만원이지만, 중앙값은 약 2억 4,500만원이에요 (출처: 통계청·금융감독원·한국은행 「2024년 가계금융복지조사」).
거의 2억원 가까이 차이가 나죠. 어느 쪽이 "보통 사람의 삶"에 더 가까울까요? 당연히 중앙값이에요. 뉴스가 평균만 보여주면서 중앙값을 숨기면, 현실이 실제보다 훨씬 풍요롭게 보이는 착시가 생겨요.
🏊 "평균 수심 1m" 강에서 빠져 죽는 이유
평균의 함정을 보여주는 또 다른 고전적인 예시가 있어요.
어떤 강이 있는데, 평균 수심이 1m래요. 키가 170cm인 어른이라면 "뭐, 걸어서 건널 수 있겠네" 싶잖아요. 그런데 실제 들어가 보니, 어떤 구간은 무릎까지만 오고, 어떤 구간은 갑자기 3m 깊이로 푹 꺼져 있어요.
평균은 1m가 맞아요. 하지만 그 평균이 당신의 안전을 보장해주진 않아요. 수영을 못 한다면 3m 구간에서 생명을 잃을 수도 있죠.
자, 이게 바로 통계학에서 말하는 분산(variance) 의 문제예요. 평균이 같아도, 값들이 얼마나 퍼져 있는지는 완전히 다를 수 있어요.
- A 강: 수심이 모두 95cm~105cm (평균 1m)
- B 강: 수심이 10cm~3m를 오감 (평균 1m)
두 강의 평균은 똑같이 1m지만, 위험도는 하늘과 땅 차이예요. 그래서 통계를 제대로 보려면 평균 옆에 표준편차나 분포 모양이 꼭 같이 있어야 해요.
수식으로 표현하면 분산은 이렇게 계산해요.
복잡해 보여도 핵심은 간단해요. "각 값이 평균에서 얼마나 떨어져 있는지"를 제곱해서 평균 낸 값이에요. 이 숫자가 크면 값들이 널뛰기를 한다는 뜻이고, 작으면 값들이 평균 근처에 옹기종기 모여 있다는 뜻이죠.
🎯 평균이 통하는 경우, 통하지 않는 경우
그럼 평균은 쓸모없는 숫자일까요? 그건 아니에요. 평균이 잘 작동하는 상황이 분명히 있어요.
데이터가 좌우 대칭의 종 모양(정규분포)에 가까울 때는 평균이 꽤 정직하게 전체를 대표해요. 예를 들어 성인 남성의 키, 같은 시험을 본 학생들의 점수 같은 건 대체로 평균 주변에 몰려 있거든요. 이럴 땐 "평균 키 173cm"라는 말이 실제로 많은 사람의 키를 잘 설명해줘요.
문제는 소득, 자산, 조회수, 유튜브 구독자 수처럼 한쪽으로 심하게 쏠린 분포예요. 이런 데이터에서는 극소수가 전체를 좌우하기 때문에 평균이 현실을 왜곡해요.
평균을 볼 때는 속으로 한 번 물어보세요.
"이 데이터는 종 모양일까, 아니면 한쪽으로 쏠려 있을까?"
이 질문 하나만 습관화해도, 숫자에 속을 확률이 확 줄어요.
🤔 생각해볼 거리
- 회사가 "직원 평균 연봉 8천만원"이라고 자랑할 때, 왜 중앙값은 공개하지 않을까요?
- 유튜브 채널 "평균 조회수"와 "중앙값 조회수"는 왜 10배 넘게 차이 날 수 있을까요?
- 내가 읽는 뉴스에서 "평균"이라는 단어를 발견했을 때, 그 뒤에 숨은 분포는 어떤 모양일지 한 번 상상해보는 거예요.
평균은 편리한 숫자예요. 그런데 편리한 만큼 게으른 숫자이기도 해요. 한 개의 숫자로 수백만 명의 삶을 뭉뚱그려버리니까요.
다음에 뉴스에서 "평균 ○○"를 만나면, 의심 한 번 해보는 거예요. 중앙값은 어디 갔는지, 빌 게이츠 같은 극단값이 껴 있진 않은지. 그 작은 의심 하나가 숫자에 휘둘리지 않는 힘이 돼요.
그럼 다음 글에서 또 만나요 👋
📚 참고 자료
- 통계청·금융감독원·한국은행, 「2024년 가계금융복지조사 결과」, 2024
- 평균·중앙값·분산 개념: Douglas C. Montgomery, Applied Statistics and Probability for Engineers
- "평균 수심 1m 강" 비유: Hans Rosling, Factfulness (한스 로슬링, 『팩트풀니스』, 2018)
댓글
아직 댓글이 없어요