페이크와 펙트(4부)_12장 확률을 마주치다
12장 확률을 마주치다 – 통계가 가리는 진실
"정치인은 술 취한 자가 가로등을 이용하듯이 통계를 사용한다. 밝히기보다는 기대려 한다." – 앤드루 랭
통계는 객관적인 사실을 전달하는 것처럼 보이지만, 해석 방식에 따라 완전히 다른 의미를 가질 수 있습니다. 12장은 우리가 확률과 통계를 얼마나 쉽게 오해하는지를 다양한 사례를 통해 보여줍니다.
1. 확률적 직관의 오류 – 문을 바꿔야 하는 이유
게임 쇼에서 세 개의 문 중 하나를 선택해야 합니다.
- 한 문에는 자동차가 있고, 나머지 두 문에는 염소가 있습니다.
- 당신이 1번 문을 선택하자 진행자가 3번 문을 열어 염소가 있는 것을 보여줍니다.
- 진행자가 다시 묻습니다. “2번 문으로 바꾸시겠습니까?”
- 선택을 바꾸는 것이 더 나을까요?
직관적으로는 50:50 같아 보이지만, 실제로는 선택을 바꾸는 것이 확률적으로 더 유리합니다.
- 처음 선택을 유지하면 자동차를 얻을 확률은 1/3
- 선택을 바꾸면 자동차를 얻을 확률은 2/3
이 문제는 몬티 홀 문제(Monty Hall Problem)로 알려져 있으며, 많은 사람이 본능적으로 틀린 답을 내놓습니다. 우리의 직관은 확률을 직선적으로 계산하려 하지만, 실제로는 문제의 구조를 깊이 이해해야만 옳은 결론에 도달할 수 있습니다.
👉 교훈: 확률적 직관은 종종 틀릴 수 있으며, 논리적 분석이 필요합니다.
2. 도박사의 오류 – 패턴을 찾으려는 본능이 부르는 착각
우리는 패턴을 찾고, 일정한 규칙이 있을 것이라 믿습니다. 하지만 확률 법칙은 인간의 직관과 다르게 작동합니다.
예를 들어, 동전을 20번 던졌을 때 모두 앞면이 나왔다면?
- 우리는 다음번에는 반드시 뒷면이 나올 것이라 생각할 수도 있습니다.
- 하지만 동전을 한 번 던질 때마다 앞면과 뒷면이 나올 확률은 여전히 50:50입니다.
이것을 도박사의 오류(Gambler’s Fallacy)라고 합니다.
- 과거의 결과가 미래의 확률에 영향을 미친다고 착각하는 것입니다.
- 하지만 동전 던지기는 매번 독립적인 사건이며, 과거와 무관합니다.
👉 교훈: 확률은 독립적인 사건이며, 일정한 패턴이 있다고 믿으면 착각할 수 있습니다.
3. 통계적 오류 – HIV 검사 결과를 믿어도 될까?
99.99%의 정확도를 가진 HIV 검사가 있다고 가정해 보겠습니다.
- 검사에서 양성이 나왔다면, 실제 감염 확률은 얼마일까요?
- 직관적으로는 99.99%일 것 같지만, 실제 확률은 약 50%입니다.
🔎 왜 이런 결과가 나올까요?
- HIV 감염률이 0.01%로 매우 낮기 때문에, 검사 자체가 매우 정확하더라도 거짓 양성(false positive)이 나올 가능성이 높습니다.
- 10,000명을 검사했을 때,
- 실제 감염자 1명은 99.99% 확률로 양성
- 비감염자 9,999명 중 1명도 거짓 양성(9999명 × 0.01%)
- 총 2명의 양성자가 나오며, 그중 1명만 진짜 감염자 → 양성 판정을 받았을 때 실제 감염 확률은 50%
이처럼 확률은 단순히 ‘정확도’만으로 판단할 수 없습니다.
- 맥락을 고려해야 합니다.
- 실제 감염률이 낮다면, 검사 정확도가 높아도 거짓 양성이 나올 수 있습니다.
👉 교훈: 숫자가 높다고 맹신하지 말고, 실제 확률과 조건을 분석해야 합니다.
4. 확률의 위험성 – 통계가 사람을 죽일 수도 있다
통계적 오류는 때때로 치명적인 결과를 초래합니다.
🔎 영국의 사례:
- 로이 메도라는 유명 소아과 의사가 연이은 영아 돌연사(SIDS) 사건을 통계적으로 분석했습니다.
- 그는 아이 두 명이 연달아 사망할 확률이 7300만 분의 1이라며, 이 사건이 ‘우연’이 아닐 것이라고 주장했습니다.
- 결국, 죽은 아이의 엄마는 살인자로 몰려 유죄 판결을 받았습니다.
⚠️ 그러나 이 주장은 완전히 잘못된 확률 계산이었습니다.
- 가족력이 있는 경우, 연달아 사망할 확률이 훨씬 더 높습니다.
- 단순한 확률 수치를 맥락 없이 적용하면 엉뚱한 결론이 나올 수 있습니다.
결국, 엄마는 나중에 무죄로 판명되었지만, 이미 심리적으로 피폐해져 알코올 중독으로 사망하고 말았습니다.
👉 교훈: 통계적 수치는 사람의 생명을 좌우할 수도 있으며, 잘못된 해석은 큰 비극을 초래할 수 있습니다.
5. 통계를 믿기 전에, 해석이 먼저입니다.
통계와 확률을 잘못 해석하면 심각한 오류가 발생할 수 있습니다.
- 우리는 숫자가 직관적이기를 바라지만, 실제로는 복잡한 맥락이 숨어 있습니다.
- 통계를 해석할 때는 반드시 맥락과 전제조건을 함께 고려해야 합니다.
📌 핵심 정리:
✔️ 확률적 직관이 항상 맞지는 않습니다. 숫자 뒤의 논리를 분석해야 합니다.
✔️ 도박사의 오류처럼, 과거의 결과가 미래의 확률을 바꾸지 않는 경우가 많습니다.
✔️ HIV 검사 같은 통계적 판단에서는 실제 확률을 반드시 따져봐야 합니다.
✔️ 잘못된 통계 해석은 심각한 결과를 초래할 수 있습니다.
👉 결론: 숫자는 정확하지만, 해석하는 사람의 오류가 문제입니다. 우리는 통계를 무작정 믿기 전에 반드시 "이 숫자는 어떤 의미일까?"라고 질문해야 합니다. 뛰어난 과학도 형편없는 추론을 끌어낼 수 있습니다. 직관적으로 다가오는 숫자를 믿을 것이 아니라, 그것을 해석해야 한다는 사실을 잊어서는 안 됩니다.