심슨의 역설, 통계가 거짓말하는 3가지 흔한 함정

친구가 이런 말을 했다고 해볼게요.

“데이터로 봤더니 A가 B보다 확실히 좋아.”

그럼 왠지 믿음이 가잖아요. 숫자는 감정이 없고, 데이터는 거짓말을 안 할 것 같으니까요. 그런데 말이에요. 숫자가 거짓말을 하지 않아도, 우리가 숫자를 잘못 읽으면 결론은 완전히 틀릴 수 있어요.

오늘 이야기할 주제는 통계학에서 꽤 유명한 심슨의 역설이에요.

이름은 어렵지만 핵심은 단순해요.

부분으로 보면 A가 이기는데, 전체로 합치면 B가 이기는 이상한 현상이에요. 신기하죠? 그런데 이게 실제 입학 통계, 의학 연구, 광고 성과 분석에서도 등장해요.

🧩 부분과 전체가 왜 다르게 보일까요?

가령 병원 두 곳이 있다고 해볼게요.

구분	가벼운 환자 성공률	위중한 환자 성공률	전체 성공률
A병원	높음	높음	낮아 보일 수 있음
B병원	낮음	낮음	높아 보일 수 있음

이게 말이 되냐고요?

네, 돼요. A병원이 위중한 환자를 훨씬 많이 받는다면 전체 성공률은 낮아질 수 있어요. 반대로 B병원이 가벼운 환자를 많이 받으면, 각 그룹 안에서는 성과가 낮아도 전체 성공률은 좋아 보일 수 있고요.

자, 이제 핵심이에요.

전체 숫자는 여러 그룹이 섞인 결과예요.
그런데 섞인 비율이 다르면, 전체 결과는 우리가 기대한 방향과 다르게 움직일 수 있어요.

🔄 심슨의 역설이 뭐예요?

심슨의 역설은 통계학에서 하위 집단에서는 보이던 관계가 전체 데이터를 합쳤을 때 사라지거나 반대로 뒤집히는 현상을 말해요.

수식으로 아주 간단히 보면 이런 느낌이에요.

\frac{a}{b} > \frac{c}{d}

그런데 다른 그룹까지 합치면,

\frac{a+e}{b+f} < \frac{c+g}{d+h}

처음에는 왼쪽 비율이 더 컸는데, 합치고 나니 오른쪽 비율이 더 커질 수 있다는 뜻이에요.

어렵게 느껴질 수 있는데, 그냥 이렇게 생각하면 돼요.

비율은 단순히 더하면 안 돼요.
각 그룹의 크기, 즉 “얼마나 많은 사람이 그 그룹에 들어갔는지”가 결과를 확 바꿔버리거든요.

마치 반에서 키 큰 학생들만 모아놓은 조와, 키 작은 학생들만 모아놓은 조를 섞어 비교하는 것과 비슷해요. 조 안에서는 한 학생이 더 커 보여도, 전체 조의 구성 자체가 다르면 최종 평균 키는 뒤집힐 수 있는 거죠.

🏫 실제 사례도 있었어요

심슨의 역설을 설명할 때 자주 등장하는 사례가 있어요. 바로 1973년 UC 버클리 대학원 입학 자료예요.

당시 전체 자료만 보면 남성 지원자의 합격률이 여성 지원자보다 높아 보여서 성별에 따른 차별이 있는 것처럼 보였어요. 이 자료는 1975년 Science 학술지에 실린 Bickel, Hammel, O’Connell의 논문에서 분석됐어요.

그런데 학과별로 나누어 보니 이야기가 달라졌어요.

여성 지원자가 상대적으로 경쟁률이 높은 학과에 많이 지원했고, 남성 지원자는 상대적으로 합격률이 높은 학과에 많이 지원한 영향이 컸던 거예요.

즉 문제는 단순히 “남성이냐 여성이냐”가 아니라, 어떤 학과에 지원했느냐라는 숨은 변수가 섞여 있었다는 뜻이에요.

이런 숨은 변수를 통계에서는 교란 변수라고 불러요.

개념	쉬운 뜻
전체 데이터	모든 자료를 한꺼번에 합친 것
하위 집단	조건별로 나눈 작은 그룹
교란 변수	진짜 원인처럼 보이는 관계를 흔드는 숨은 변수
심슨의 역설	나눠 보면 이기는데 합치면 지는 현상

🕵️ 교란 변수는 왜 무서울까요?

교란 변수는 말 그대로 판단을 헷갈리게 만드는 변수예요.

예를 들어 아이스크림 판매량과 익사 사고가 함께 늘어난다고 해볼게요. 그러면 아이스크림이 익사 사고를 일으키는 걸까요?

전혀 아니에요.

여기에는 날씨라는 교란 변수가 있어요. 날씨가 더워지면 아이스크림도 많이 팔리고, 물놀이도 늘어나잖아요. 그러면 익사 사고도 늘 수 있어요.

이때 아이스크림과 익사 사고는 같이 움직이지만, 한쪽이 다른 쪽의 원인이라고 보기는 어려워요.

이게 통계에서 정말 중요한 말이에요.

상관관계는 인과관계가 아니에요.

두 숫자가 함께 움직인다고 해서, 하나가 다른 하나를 만들었다고 단정하면 안 되는 거예요.

📊 그래서 데이터를 볼 때 뭘 봐야 할까요?

데이터를 볼 때는 전체 숫자 하나만 보면 위험해요. 특히 “A가 더 좋다”, “B가 더 효과적이다” 같은 결론을 내릴 때는 더 조심해야 해요.

확인 순서는 이렇게 잡으면 좋아요.

전체 결과를 먼저 봐요.
그다음 그룹별로 나눠 봐요.
결과를 뒤흔들 만한 숨은 변수가 있는지 찾아봐요.
그래도 같은 결론이 나오는지 확인해요.

자, 여기서 살짝 어려운 개념 하나만 더 볼게요.

통계에서는 이런 식으로 조건을 붙여서 확률을 보기도 해요.

P(A \mid B)

이건 “B라는 조건이 주어졌을 때 A가 일어날 확률”이라는 뜻이에요.

그냥 $P (A)$ 만 보면 전체 확률이에요. 그런데 $P(A \mid B)$ 를 보면 특정 조건 안에서의 확률을 볼 수 있어요. 심슨의 역설은 바로 이 차이를 무시할 때 자주 생겨요.

전체만 보면 $P (A)$ 가 좋아 보이는데, 조건별로 보면 $P(A \mid B)$ 는 전혀 다른 이야기를 할 수 있는 거죠.

🧠 숫자를 믿지 말라는 뜻일까요?

아니에요. 오히려 반대예요.

숫자를 더 제대로 믿으려면, 숫자가 만들어진 맥락까지 봐야 한다는 뜻이에요.

데이터는 요리 재료와 비슷해요. 좋은 재료가 있어도 조리법을 틀리면 이상한 음식이 나오잖아요. 통계도 그래요. 자료 자체는 맞아도, 묶는 방식과 해석이 틀리면 결론이 이상해질 수 있어요.

그러니까 앞으로 어떤 통계를 볼 때 이런 질문을 던져보면 좋아요.

이 숫자는 전체만 본 걸까?
그룹별로 나눠도 같은 결론일까?
숨은 조건이 결과를 바꾼 건 아닐까?

이 세 가지만 떠올려도 통계를 보는 눈이 훨씬 날카로워져요.

✨ 마무리

심슨의 역설은 “통계는 믿을 수 없다”는 이야기가 아니에요.

오히려 통계를 제대로 읽으려면 전체와 부분을 함께 봐야 한다는 이야기예요.

숫자는 강력해요. 하지만 숫자는 스스로 말하지 않아요. 우리가 어떤 기준으로 묶고, 어떤 조건을 빼먹고, 어떤 맥락에서 해석하느냐에 따라 완전히 다른 이야기가 될 수 있어요.

그러니 다음에 “데이터가 증명했다”는 말을 들으면 바로 믿기 전에 한 번만 물어보세요.

“그거, 나눠서 봐도 같은 결론이에요?”

이 질문 하나가 생각보다 많은 착각을 막아줄 거예요.

그럼 다음 글에서 또 만나요 👋

📚 참고 자료

Simpson’s Paradox 개념 설명: Encyclopaedia Britannica
UC Berkeley 1973 대학원 입학 자료: Berkeley Graduate Admissions Dataset
버클리 입학 사례 원논문: Bickel, Hammel, O’Connell, “Sex Bias in Graduate Admissions: Data from Berkeley,” Science, 1975
조건부 확률 개념: 일반 통계학 교재의 Conditional Probability