UPDATED. 2022-08-08 10:46 (월)
[새책] 숫자에 속지 않고 숫자 읽는 법
[새책] 숫자에 속지 않고 숫자 읽는 법
  • 파퓰러사이언스
  • 승인 2022.04.13 09:21
  • 댓글 0
이 기사를 공유합니다

- “숫자는 어떻게 만들어지고, 어떻게 사용되고, 어떻게 잘못되는가?”
- 뉴스에서 믿을 만한 숫자, 믿지 못할 숫자 가려내는 법

여론조사 결과부터 범죄 건수, 경제성장률, 코로나19 확진자 수까지, 숫자로 둘러싸인 세상에서 어떻게 하면 상황을 제대로 이해하고 더 나은 판단을 내릴 수 있을까? 우리는 하루에도 수많은 숫자를 접한다. 수많은 통계가 뉴스 헤드라인에 등장하고, 언론과 미디어는 경쟁이라도 하듯 충격적인 숫자를 노출한다. SNS와 유튜브에서는 짜릿한 수치들이 왜곡된 채 퍼져나간다. 오늘날만큼 진실과 거짓을 가려내는 능력이 필요한 시기는 없었던 듯하다. 또한 코로나19라는 격변의 시대를 지내오며 전 세계는 감염재생산지수, 총사망자 수 등 통계 개념에 대해 황급히 배우게 됐다. 통계학자 프레더릭 모스텔러는 “통계 없이 진실을 말하기는 어렵다”라고 했는데, 각종 통계 수치에서 진실을 찾아내야 하는 시절이 되었다. 이런 때일수록 숫자를 읽는 힘이 절실하다. 정확하게 숫자를 읽는 힘은 세상을 이해하는 강력한 도구이다.

《숫자에 속지 않고 숫자 읽는 법》은 부정확하거나 모순되는 결과들을 그럴싸한 숫자로 포장한 것을 가려내고, 필요한 정보를 정확하게 파악하는 법을 제시하는 안내서이다. 겉으로 단순해 보이는 숫자가 어떻게 본질을 호도하고 오류를 낳는지 설명한다. [가디언] [데일리 텔레그래프] [더 타임스] 등 최근 영국의 실제 뉴스 헤드라인을 예시로 들어 꼭 필요한 통계 원리를 설명하는데, 수학 지식이 전혀 없어도 누구나 쉽게 이해하고 재미있게 읽을 수 있다.

영국에서 ‘올해의 과학작가’로 뽑히고 영국 언론상을 수상하기도 한 톰 치버스와 그의 사촌인 더럼대학교 경제학과 교수 데이비드 치버스 콤비의 친절하면서도 유쾌한 서술이 돋보이는 책이다. 중앙값, 표준편차 같은 기본적인 통계 용어부터 p값, 체리피킹, 표집 편향, 베이즈 정리 같은 평소에 이해하지 못했던 통계에 관한 지식 전반을 22개의 짤막한 장에서 부담 없이 풀어내는데, 영국식 유머와 흡인력 있는 사례들 덕에 독자들은 재미있게 읽느라 얼마나 많은 것을 배우고 있는지조차 알아차리지 못할 것이다. 부록으로 수록한 ‘통계 스타일 가이드’는 ‘숫자의 맥락을 제시하라’, ‘상대위험뿐 아니라 절대위험도 함께 제시하라’, 숫자 하나로 예보하지 말고 신뢰구간을 함께 제시하라’와 같은 핵심적인 유의점 11가지를 추려 제시하는데, 숫자를 다루는 사람들에게 유용한 지침이 될 것이다.

이 책에는 실제 영국의 흥미진진한 최신 뉴스 기사들이 등장한다. 선거 여론조사부터 일기예보, 경제지표 등 우리나라에서도 흔히 볼 법한 사례들이어서 더욱 공감하며 읽을 수 있다. 저자는 뉴스 속 숫자의 오류를 바로잡으며 숫자 이면의 숨은 의도를 어떻게 간파할 수 있는지를 설명한다.

● 측정대상과 방식에 따라 수치는 완전히 뒤바뀔 수 있다

영국에서 “자폐증 급속 확산, 54명 중 1명”이라는 헤드라인을 달고 기사가 쏟아졌다(12장). 미국 질병통제예방센터에서 발표한 자폐증 환자 비율을 보면 2000년 150명 중 1명에서 2016년 54명 중 1명으로 몇 배나 급격히 높아졌는데 여러 전문가와 언론은 중금속 오염, 살충제, 심지어 ‘냉담한 부모’까지도 그 원인으로 지목했다. 하지만 그 원인은 단순했다. 의학계에서 자폐증의 정의를 확대해왔고 이에 따라 더 많은 아동을 대상으로 진단 검사를 실시했기 때문이었다. 측정대상이나 방식에 따라 숫자가 바뀔 수 있으므로, “혐오범죄, 5년 동안 2배 증가”, “코로나19 사망자 수 급증”처럼 수치가 급격히 변하는 사례를 유의해야 한다.

● 생존자 편향의 오류, 걸러진 데이터로 끼워 맞추기

“베스트셀러의 공통 특성, 2,800가지 밝혀져”라는 기사 역시 완벽한 오류다(20장). 각자 다른 색 모자를 쓴 1,000명에게 주사위를 굴리게 했는데, 네 번이나 연속으로 6이 나온 주황색 모자를 쓴 사람을 보고 “주사위를 굴려 연속으로 6이 나오는 비밀은 주황색 모자를 쓰는 것이군요”라고 말하는 것과 다를 바 없다. 어느 악랄한 범죄자를 조사해 그가 평소 폭력적인 게임을 좋아했다는 사실을 알게 되었다고 하자. 이를 두고 “폭력적인 게임을 즐길수록 범죄자가 될 확률이 높다”라고 말하는 것도 마찬가지다. 이것은 특정 결과에 편향된 표본을 끼워 맞추는 ‘생존자 편향’의 전형적인 사례다. 소수의 성공한 사례를 일반화시키는 이 오류가 빈번히 벌어지고 있음에 주의해야 한다.

● 정확한 숫자 뒤엔 불확실성 구간이 있다

영국 예산책임청에서는 2020년도 경제성장률을 1.2퍼센트로 예측하며 불확실성 구간을 -0.8에서 3.2퍼센트로 두었다(17장). 사실상 이 불확실성 구간 수치는 ‘심각한 경기침체와 거대한 경제호황 사이의 어디쯤’ 정도의, 오차범위가 매우 큰 수준이지만 헤드라인에는 그 중간인 1.2퍼센트만 보도되었다. “코로나19 사망자 수 50만 명 넘을 것”, “실업률 2% 낮아질 것” 같은 헤드라인 속 숫자는 불확실성 구간에서 가운데를 차지하는 값에 불과하다. 단정적인 수치 예측만 보도하는 것은 위험하다. 언론은 이런 불확실성 구간도 함께 보도할 의무가 있다.

● 숫자로 속이는 법, 숫자에 속지 않는 법

저자는 우리가 평소 알아차리지 못해 속아왔던 숫자의 속임수를 낱낱이 공개한다. 숫자의 어떤 부분이 왜곡되었고 어떻게 경계해야 하는지를 일깨워준다. 그중 하나는 시작점과 끝점을 자기에게 유리한 것으로만 고르는 ‘체리피킹’이다(16장). 예를 들어 현 정부 관료가 아동빈곤 문제가 개선되었다고 주장하려면 아동빈곤율이 가장 높았던 연도를 시작점으로 잡고, 야당 당원이라면 아동빈곤율이 특히 낮았던 연도를 시작점으로 잡으려 할 것이다. 즉, 튀는 데이터를 고르면 진실을 가리는 이야기를 전할 수 있는 것이다. 이외에도 표본이 작은 연구로 편향된 결과 사용하기(4장), 뭔가 나올 때까지 데이터를 잘게 쪼개서 원하는 숫자 만들기(5장), 단순한 상관관계를 인과관계로 둔갑시키기(8장), 실제로는 아무 일도 없는데 마치 무슨 일이 일어나는 것처럼 조장하기(19장) 등을 소개한다.

기사를 쓰고 뉴스를 전달하는 언론인부터 각종 뉴스레터를 발송하는 미디어 기업, 수치로 정책을 발표하는 정치인, SNS나 유튜브 등 매체를 다루는 인플루언서, 트렌드와 이슈에 민감한 콘텐츠 에디터, 출퇴근길에 하루 뉴스를 확인하는 직장인까지, 숫자를 책임감 있게 다루어야 할 사람 모두에게 이 책을 권한다.
“통계학의 기본적 소양을 갖추는 데 큰 도움이 될 이 책이 나와 정말 반갑다. 이 책은 숫자를 건강하게 의심할 수 있는 힘을 길러줄 것이다. 통계를 읽는 힘을 원하지만 그렇다고 통계 전문가가 될 생각은 없는 사람들에게는 더할 나위 없이 좋은 책이다.”(옮긴이의 말 중)

 

파퓰러사이언스 webmaster@popsci.co.kr

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.