데이터 생존 로그

💬통계와 관련된 알쓸신썰 3가지! 본문

생존 도구🏹

💬통계와 관련된 알쓸신썰 3가지!

분석가 베어그릴스 2024. 11. 10. 18:07

이번 게시글에서는 통계와 관련된 알아두면 쓸모 있을 (수도 있는...) 신기한 썰 몇 개를 소개해 보겠다!

 

🏀 마이클 조던이 만든 '지리학과 신화'

대학 졸업 후 가장 높은 연봉을 기대할 수 있는 학과는 어디일까?

의대, 법대 같은 전문직 학과가 떠오르겠지만, 미국 노스캐롤라이나 주립대에서는 뜻밖의 결과가 나왔디.

바로 지리학과가 평균 연봉 1위를 차지한 것!

 

하지만 이 결과의 비밀은 다름 아닌 전설적인 농구 스타 마이클 조던 덕분이었다.

조던은 노스캐롤라이나 주립대 지리학과 출신으로, NBA에서 역대 최고 연봉 기록을 세웠다.

그의 연봉인 3,300만 달러(약 390억 원) 덕분에 지리학과의 평균 연봉이 치솟았다.

 

이렇듯 조던 한 명의 초고액 연봉이 지리학과 전체를 고액 연봉 학과로 보이게 만든 것이었다!

이 사례는 통계에서 흔히 발생하는 평균의 함정을 보여준다.

평균이라는 지표는 극단적인 값에 영향을 크게 받기 때문에, 이를 보완하기 위해 중앙값이나 분산 같은 보조 지표를 함께 살펴보는 게 중요하다는 의미!


💉 COVID-19 백신과 심슨의 역설

간혹, 데이터를 보다보면 뭔가 잘못되었다는 생각이 들 때가 있다.

분명 부분적으로는 같은 방향을 가리키는데, 전체적으로 보면 결과가 반대인 경우! 바로 이게 심슨의 역설(Simpson’s Paradox) 이다.

 

심슨의 역설은 부분 데이터전체 데이터의 결과가 완전히 다른 방향으로 나타날 때 발생하는 통계적 함정이다. 무슨 말인지 헷갈릴 수 있으니, 사례로 바로 이해해 보자.

 

2022년 9월 미국에서 발생한 COVID-19 사망자는 총 12,593명. 이 중 39% 는 백신 미접종자, 그리고 나머지 61% 는 백신 접종자였다. "백신 접종자가 더 많이 사망했다고?"라는 의문이 들 수밖에 없다. 하지만 이 숫자만으로 판단하면 큰 오해가 생긴다!

백신을 맞은 사람들이 더 많이 사망한 것처럼 보이는 이유는 간단하다. 미국의 백신 접종자 대부분이 고령자와 기저질환자 등 고위험군이었기 때문이다. 이들은 백신을 맞지 않았을 때 COVID-19로 인한 사망 위험이 훨씬 더 높다.

 

그러나 데이터를 연령과 위험 요인별로 조정해 보면, 백신과 부스터샷을 맞은 사람들의 COVID-19 사망 위험은 미접종자보다 18.6배 낮았다는 결과가 나온다. 즉, 백신은 고위험군에서도 충분히 효과를 발휘하고 있던 셈이다!


✈️ 전투기의 생존과 장갑판의 역설

2차 세계대전 당시, 미군은 전투기에 장갑판을 어디에 부착해야 할까?라는 고민에 빠졌다.

그 시절의 통계 리서치 그룹(SRG)은 살아 돌아온 전투기를 조사해 총알 자국이 집중된 곳에 장갑을 덧대야 한다고 판단했다.

 

빨간 점들이 총알이 뚫은 자국을 나타낸다고 생각해보자.

전투기 기체, 날개 등 군데군데 박힌 자국들이 보인다.

SRG는 여기다 장갑을 달면 전투기의 생존 가능성을 높일 수 있을 거라 생각했던 것이었다!

문제는 이런 분석이 틀렸다는 것이었다!

수학자 아브라함 월드는 이 데이터를 뒤집어봤다. 돌아오지 못한 전투기의 데이터를 고려하지 않은 채 살아남은 전투기만 조사했기 때문에 생존자 편향(Survivorship Bias)이 발생한 것.

 

사실 총알 자국이 없는 곳, 즉 엔진이나 중요한 내부 부위에 총알이 맞으면 전투기는 돌아오지 못했을 가능성이 높았다.

이걸 간과한 결과, 잘못된 결론에 도달할 뻔했던 것이다.

결국, 월드의 분석 덕분에 장갑은 총알 자국이 없는 부분, 특히 엔진과 중요한 부위에 더해졌고, 이는 전투기의 생존률을 크게 높이는 데 기여했다고 한다.

 

반응형
Comments