본문 바로가기
꼼꼼히 책 읽기/일반

페이크와 팩트(4부)_13장 신호를 바꾸다

by 코코도두 2025. 2. 16.

페이크와 팩트 책 표지 이미지 (4부/13장)
페이크와 팩트 (4부/13장) _신호를 바꾸다

13장 신호를 바꾸다 – 통계가 가리는 진실

"통계는 수학의 일부이지만, 해석하는 순간부터 심리학이 된다." – 네이트 실버

 

통계는 숫자로 이루어진 객관적인 정보처럼 보이지만, 해석과 사용 방식에 따라 완전히 다른 의미로 변할 수 있습니다. 13장은 잘못된 통계 해석과 교란 변수, 통계적 오류가 어떻게 진실을 왜곡하는지를 다양한 사례를 통해 보여줍니다.


1. 통계 속 숨겨진 함정 – 심슨의 역설

1973년, 버클리대학교가 성차별로 고소를 당했습니다.

  • 남성 지원자의 합격률: 44%
  • 여성 지원자의 합격률: 35%

통계적으로 여성 지원자의 합격률이 낮았으므로, 학교가 성차별을 했다고 생각할 수도 있습니다. 그러나 자세히 분석해보니 상황이 달랐습니다.

  • 여성들은 경쟁이 심한 학과(예: 영문학, 심리학)에 지원한 비율이 높았고,
  • 남성들은 상대적으로 경쟁이 덜한 학과(예: 공학, 물리학)에 지원한 비율이 높았습니다.

즉, 합격률의 차이는 성차별 때문이 아니라 지원 경향 차이 때문이었습니다.
이처럼 부분 집단에서는 보이는 패턴이 전체 집단에서는 반대로 나타나는 현상 심슨의 역설이라고 합니다.

 

👉 교훈: 통계의 겉모습만 보고 성급한 결론을 내리면 안 됩니다.

 


2. 인과관계 vs. 상관관계 – 우리가 헷갈리는 문제

흔히 "상관관계가 인과관계를 의미하지 않는다"는 말을 합니다.

예를 들어,

  • 여름철 아이스크림 판매량이 증가하면 익사 사고도 증가합니다.
  • 그렇다고 해서 "아이스크림이 익사의 원인"이라고 말할 수 있을까요?

🔎 교란 변수(잠복 변수)를 고려해야 합니다.

  • 아이스크림 판매량과 익사 사고 증가의 공통 요인은 더운 날씨입니다.

하지만 많은 경우, 이런 교란 변수를 무시한 채 잘못된 인과관계를 주장하는 일이 발생합니다.

❌ 예: "우체국에서 사망한 사람의 비율이 병원보다 낮다 → 병원보다 우체국이 치료에 더 적합하다."
✅ 올바른 해석: 병원에는 중증 환자가 많기 때문에 사망률이 높다.

 

👉 교훈: 통계를 볼 때, 보이지 않는 교란 변수를 고려해야 합니다.

 


3. 콜레라와 잘못된 가설 – 우물가의 비극

1854년 런던, 소호 지역에서 콜레라가 창궐했습니다. 당시 많은 사람들은 "더러운 공기(미아스마)"가 질병을 전파한다고 믿었습니다.

그러나 의사 존 스노우(John Snow)는 생각이 달랐습니다.

  • 그는 생존자의 행동 패턴을 분석했고,
  • 콜레라 환자들이 브로드가 펌프에서 물을 마셨다는 공통점을 발견했습니다.

그의 연구 덕분에 결국 콜레라의 원인은 공기가 아니라 오염된 물이라는 것이 밝혀졌습니다. 하지만 지역 유지들은 이를 인정하지 않았고, 펌프 손잡이를 다시 설치했습니다. 왜일까요?

  • 진실을 인정하면 기존의 믿음을 완전히 뒤집어야 했기 때문입니다.
  • 대중이 충격을 받을까 봐 현실을 부정한 것입니다.

👉 교훈: 우리가 믿고 싶은 것과 진실은 다를 수 있으며, 과학적 발견이 반드시 환영받는 것은 아닙니다.


4. 테라노스 – 실리콘밸리 최대의 사기극

실리콘밸리 스타트업 테라노스(Theranos)는 "혈액 한 방울로 30여 가지 질병을 진단할 수 있다"고 주장했습니다.

  • 창업자 엘리자베스 홈스(Elizabeth Holmes)는 "제2의 스티브 잡스"로 불리며 엄청난 투자를 유치했습니다.
  • 90억 달러(약 12조 원) 기업 가치를 인정받고, 정치·경제계 거물들이 테라노스를 지지했습니다.

그러나 과학자들은 의심했습니다.

  • 소량의 혈액으로 정확한 질병 진단이 가능하다는 주장 자체가 기본적인 통계 원칙을 무시한 것이었습니다.
  • 테라노스는 기술을 공개하지 않고 비밀주의 전략으로 투자자를 끌어들였습니다.

결국, 기기의 정확성이 매우 낮다는 사실이 밝혀졌고

  • 홈스는 투자자와 정부를 속인 혐의로 기소되었습니다.
  • 테라노스의 가치는 0원으로 추락했습니다.

👉 교훈: 기술이 아무리 혁신적으로 보이더라도, 기본적인 통계 원칙을 무시하면 실패합니다.


5. 민감도와 특이도 – 진단 검사의 한계

테라노스의 실패는 단순한 사기극이 아니라, 통계적 개념을 무시한 결과였습니다.

  • 민감도(Sensitivity): 질병이 있는 사람을 정확히 찾아내는 비율.
  • 특이도(Specificity): 질병이 없는 사람을 정확히 가려내는 비율.

진단 검사는 항상 오류가 있을 수밖에 없으며,

  • 무작위로 수십 개의 질병을 검사하면 거짓 양성(false positive)이 많아질 확률이 높아집니다.

테라노스의 기술이 실제로 작동했다고 해도,

  • 한 번의 검사로 30여 가지 질병을 진단하려는 시도 자체가 비현실적이었습니다.

👉 교훈: 의료 기술은 신중해야 하며, 과학적 검증 없이 맹신하면 위험합니다.


결론 – 통계를 비판적으로 바라보기

우리는 숫자가 주는 객관성에 쉽게 속습니다.
하지만 잘못된 해석과 교란 변수, 심슨의 역설 같은 통계적 함정이 도처에 존재합니다.

  • 통계 수치를 볼 때는 "왜 이런 숫자가 나왔을까?"를 항상 생각해야 합니다.
  • 단순한 상관관계만 보고 원인을 단정하면 오류를 범할 수 있습니다.
  • 기술과 혁신도 과학적 검증을 거치지 않으면 사기극이 될 수 있습니다.