박영아 교수 "4.15 총선 결과 통계적 불가능" vs 이병태 교수 "조건부 확률을 독립확률로 계산하는 오류"
박영아 교수 "4.15 총선 결과 통계적 불가능" vs 이병태 교수 "조건부 확률을 독립확률로 계산하는 오류"
이 기사를 공유합니다

박영아 교수"서울 424개 모든 동에서 민주당 후보의 '사전선거 득표율-당일득표율'은 +12%"
"이는 2의 424승 분의 1의 확률...1000개 동전 동시 던져 모두 앞편 나오는 것과 같아. 인위적 작동 있었다고 봐야"
이병태 교수 "박 교수 주장은 조건부 확률을 독립의 확률로 계산하는 오류...또, 현상에 맞는 사례만 모아 놓고 확률 계산하는 오류 범하고 있어"

 

제18대 국회의원을 지낸 박영아 명지대 물리학과 교수(미 펜실베니아 대학 물리학 박사)가 4.15총선 투표조작 의혹을 제기하며 "통계적으로 불가능한 일이 21대 총선에서 일어났다"고 주장했다. 이에 대해 이병태 카이스트 경영학과 교수(미 텍사스 오스틴 대학 경영학 박사)는 박 교수가 조건부 확률을 독립 확률로 계산하는 오류를 범하고 있다고 지적했다. 

박영아 교수는 23일 자신의 페이스북을 통해 "4.15 총선 결과를 보면 통계적으로 불가능한 일이 일어 났다"며 "자료에 의하면 서울 49개 선거구를 동별로 보면 424개 동인데, 이 424개 모든 동에서 민주당 후보의 (사전선거 득표율-당일득표율)은 +12% 근처의 정규분포 비슷한 모양의 히스토그램을 그렸다"고 했다. 그러면서 "이런 일이 일어날 확률은 2의 424승 분의 1"이라고 했다.

박영아 교수 페이스북 캡처
박영아 교수 페이스북 캡처
박 교수가 인용한 히스토그램 (자유바람 저장소, https://freedomstorage.blogspot.com/)

 

그는 "인용한 히스토그램 (자유바람 저장소, https://freedomstorage.blogspot.com/)은 서울 49개 지역구를 구성하는 424개 동에서 더불어민주당후보의 사전선거득표율과 본선거득표율의 차이를 변수로 해서 가로축으로 하였다. 세로축은 각각의 구간에서 발생한 빈도를 그린 것"이라며 "그런데 이 차이값이 424개 서울 모든 동에서 플라스(+) 값으로서 12% 근처에 모여 있다는 것"이라고 했다.

이어 "정상적인 경우라면 세로축을 중심으로 플러스인 지역도 있고, 마이너스(-)인 지역도 있게 되어 세로축을 중심으로 종(鍾) 모양이다. 통계학에서는 이 커브를 수학자 가우스(Gauss) 이름을 따서 가우스 곡선 또는 정규분포곡선이라고 한다"고 했다.

정규분포곡선 (박영아 교수 페이스북 캡처)

박교수는 "사전선거의 선거상황(여론, 지지자들의 결집도 등등)이 차이가 없다면 이 득표율의 차이가 플러스가 될 확률은 반반 즉 50%이다. 따라서 지금처럼 득표율차이가 +가 될 확률은 1/2, 즉 0.5이다"라며 "그런데 이런 경우가 424번 연속 발생했으니까, 그 확률은 2의 424승분의 1이다"라고 했다. 그러면서 "그리고 수도권 선거구 전체 1000개이상의 동에서 같은 일이 일어날 확률은 2의 1000승분의 1이다 . (수도권 전체에서 선거구별로 사전선거득표율이 본투표득표율보다 10%정도 높았으며 동별로도 그런 것으로 알고 있다) 이 수를 10의 승으로 표현하면 10의 301승분의 1이다"라며 "이 확률은 정말 정말 작은 숫자"라고 강조했다.

그는 "이런 정도의 사건이 현실세계에서 일어나는 것을 보는 것은 불가능하다"며 마치 "1000개의 동전을 동시에 던졌을때 모두 앞면이 나오는 경우를 볼 수 없는 것과 같다"고 했다. 

그러면서 "그렇다면 이런 선거결과를 어떻게 해석해야 하는가?"라며 "인위적인 작동이 있었다고 "통계학적"으로 해석될 수 밖에 없다"고 했다.

이병태 교수 "조건부 확률을 독립의 확률로 계산하는 오류...또, 현상에 맞는 사례만 모아 놓고 확률 계산하는 오류 범하고 있어"

이병태 교수는 박 교수의 주장에 대해 대해 "그걸 독립 사건이고 동시 발생 확률로 계산하시니 그런 계산이 나온다"고 했다.

그는 "예를 들겠습니다. 한국의 지역에 특정 계절에 비가 올 확률이 10%다. 이런데 100개 군에 동시에 비가올 확률은 0.1의 100승이 되어 불가능하다고 주장하는 것과 같다"고 했다. 이어 "그런데 한반도를 덮는 먹구름이 왔을 때 전국에 비가 동시에 올 확률은 1이된다"라며 "바로 전국을 덮는 비구름의 조건부 확률이지요. 많은 분들이 조건부 확률을 자꾸 독립의 확률로 계산하고 계시고 있다"고 강조했다.

이 교수는 "또 하나의 오류는 그 현상에 맞는 사례를 모아 놓고 확률계산을 하는 오류를 범한다"고 했다. 그는 "색이 두가지인 항아리에서 구슬을 1000개 꺼냈는데 같은 색이 9개가 나올 확률과, 처음부터 갈색 9개만 연달아 나올 확률은 전혀 다른데 의심에 맞는 것만 골라서 동시에 발생할 확률을 구하는 오류들을 범하고 있다"라며 "제 예에서 먹구름이, 민주당 지지자들이 더 많이 뛰쳐나온 것에 비유된다"고 했다.

이 교수는 "서울 인천 경기의 양당 지지율을 광역으로 보면 크게 다르지 않다"며 "이것 이외는 아무런 의미도 없는 데이타를 갖고 온갖 음모론을 시작했다"고 했다.

*아래는 이병태 교수 페이스북 캡처

 

김민찬 기자 mkim@pennmike.com

 

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 63
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.