본문 바로가기
꼼꼼히 책 읽기/일반

페이크와 팩트(4부)_14장 숫자는 클수록 좋은 법

by 코코도두 2025. 2. 16.

페이크와 팩트 책 표지 이미지 (4부/14장)
페이크와 팩트 (4부/14장)_숫자는 클수록 좋은 법

14장 숫자는 클수록 좋은 법 – 통계가 가리는 진실

"통계는 수학의 일부이지만, 해석하는 순간부터 심리학이 된다." – 네이트 실버

 

숫자는 객관적인 듯 보이지만, 해석 방식에 따라 완전히 다른 의미로 변할 수 있습니다. 14장은 통계를 이용한 과장과 오해가 어떻게 대중을 속이고 잘못된 결정을 유도하는지를 다양한 사례를 통해 보여줍니다.


1. 발암물질 논란 – 숫자가 만들어내는 공포

2015년, 세계보건기구(WHO) 산하 국제암연구소(IARC)는 가공육이 1급 발암물질이며, 대장암 위험을 18% 증가시킨다고 발표했습니다.

  • 언론은 "베이컨과 핫도그는 흡연만큼 위험하다!"며 선정적으로 보도했습니다.
  • 그렇다면 고기를 먹는 것이 폐암을 일으키는 담배와 같은 수준의 위험이라는 의미일까요?

🔎 발암물질 등급의 진짜 의미

  • 1급 발암물질이라는 등급은 위험의 강도가 아니라, 위험성을 뒷받침하는 증거의 신뢰도를 의미합니다.
  • 즉, 담배, 햇빛, 석면이 같은 1급 발암물질로 분류될 수 있지만, 실제 위험 수준은 각각 다릅니다.

🔎 실제 위험도 분석

  • 영국인의 대장암 발병률은 1000명 중 61명입니다.
  • 가공육을 적게 먹는 집단: 1000명 중 56명
  • 가공육을 많이 먹는 집단: 1000명 중 66명
  • 즉, 가공육을 많이 먹는다고 해서 암에 걸릴 확률이 단 1% 증가하는 것입니다.

📌 이 1% 차이를 "18% 증가"라고 표현하면 완전히 다른 느낌이 됩니다.

 

👉 교훈: 절대위험도를 무시하고 상대위험도만 강조하면 숫자가 왜곡될 수 있습니다.


2. 확률의 거짓 – 상대적 위험도가 주는 착시

🔎 제약회사의 통계 조작법

심장마비 예방 신약을 평가하는 임상 시험을 가정해 보겠습니다.

  • 위약(가짜 약)을 먹은 1000명 중 5명이 심장마비 발생
  • 신약을 먹은 1000명 중 4명이 심장마비 발생

 절대위험도 감소: 0.1% (1000명 중 1명 차이)
 상대위험도 감소: 20% (5명 → 4명, 즉 20% 감소)

📌 제약회사는 "신약이 심장마비 위험을 20% 줄인다"고 광고하지만, 사실 이는 0.1% 차이에 불과합니다.

 

👉 교훈: 상대위험도만 강조하는 통계는 오해를 불러일으킬 수 있습니다.


3. 통계의 함정 – 숫자의 기준이 바뀌면 결과도 달라진다

🔎 부동산 가격 예제

집값이 20만 유로에서 50% 하락한 후, 다음 해에 50% 상승했다면 원래 가격을 회복했을까요?

  • 첫해 50% 하락 → 10만 유로
  • 다음 해 50% 상승 → 15만 유로

📌 집값은 원래 가격의 75% 수준이지만, 단순히 "50% 올랐다"는 표현만 보면 착각할 수 있습니다.

 

👉 교훈: 숫자의 기준점이 달라지면 결과 해석도 달라집니다.


4. 통계적 유의도 – 과학 연구는 얼마나 신뢰할 수 있을까?

🔎 통계적 유의도(p-value)란?

과학 연구에서 p-value < 0.05면 결과가 "유의미하다"고 판단합니다. 하지만 이는 단순한 확률일 뿐입니다.

 

🔎 문제점

1️⃣ 작은 표본 문제 – 연구 대상이 적으면 우연한 변수가 결과에 큰 영향을 줄 수 있습니다.
2️⃣ 효과 크기의 문제 – 차이가 유의미하다고 해서 임상적으로 중요한 것은 아닙니다.
3️⃣ 출판 편향 – 긍정적인 연구 결과만 논문으로 발표되는 경향이 있습니다.

 

🔎 실제 사례

  • 2005년, 의학 연구에서 발표된 결과의 절반 이상이 후속 연구에서 재현되지 않았습니다.
  • 즉, 통계적으로 "유의미한" 결과라고 해서 반드시 사실인 것은 아닙니다.

👉 교훈: 과학 연구 결과도 절대적으로 신뢰할 수 없으며, 연구 방법과 표본 크기를 고려해야 합니다.


5. 숫자의 결함을 발견하기 – 어떻게 속지 않을 것인가?

🔎 숫자를 맥락 없이 보면 오해할 가능성이 큽니다.

  • "이 약을 먹으면 부작용 확률이 10%" → 환자 100명 중 10명이 영향을 받는다는 뜻입니다.
  • 📌 숫자를 백분율 대신 실제 수치로 보면 더 직관적으로 이해할 수 있습니다.

📌 핵심 정리

✔️ 절대위험도 vs 상대위험도 – 상대위험도만 강조하면 과장이 될 수 있습니다.
✔️ 백분율의 함정 – 기준이 다르면 숫자가 다르게 보입니다.
✔️ p-value의 한계 – 통계적으로 유의미하다고 해서 반드시 중요한 것은 아닙니다.
✔️ 통계적 착시 – 통계는 맥락 없이 보면 오해를 불러일으킵니다.

 

 

👉 결론: 숫자는 중요하지만, 그것을 해석하는 방식이 더 중요합니다. 통계를 볼 때는 반드시 "이 숫자는 어떤 맥락에서 나온 것일까?"를 먼저 생각해야 합니다