[팩트체크] 월터 미베인 '4·15 총선 부정' 보고서 검증
상태바
[팩트체크] 월터 미베인 '4·15 총선 부정' 보고서 검증
  • 임해원 기자
  • 승인 2020.05.06 17:22
  • 댓글 10
이 기사를 공유합니다

지난달 29일, 21대 총선에서 선거부정이 발생했을 가능성이 있다는 내용의 보고서를 발표해 논란의 중심에 선 월터 미베인 미국 미시건대 정치학과 교수. 사진=미시건대 홈페이지 갈무리
지난달 29일, 21대 총선에서 선거부정이 발생했을 가능성이 있다는 내용의 보고서를 발표해 논란의 중심에 선 월터 미베인 미국 미시건대 정치학과 교수. 사진=미시건대 홈페이지 갈무리

21대 총선이 끝난 지 3주가 지났지만, 여전히 보수층을 중심으로 투표조작설에 대한 논란이 끊이지 않고 있다. 여기에 미국 정치학과 교수가 선거부정 가능성을 제시하는 보고서를 발표해 불붙은 논란에 기름을 끼얹은 모양새다.

미국 미시간대학교 정치학과 월터 미베인(Walter Mebane) 교수는 지난달 29일 ‘2020 한국 총선에서의 부정(Frauds in the Korea 2020 Parliamentary Election)’이라는 제목의 보고서를 발표했다. 해당 보고서는 전체 선거구 중 244개에서 선거부정이 발생했을 수 있으며, 전체 투표수의 7.26%(더불어민주당 당선 지역구 득표수의 10.43%)가 조작됐을 가능성이 있다는 내용을 담고 있다.

해외 석학이 선거 부정 가능성을 제기한 보고서를 발표하자 국내에서도 투표조작설을 지지하는 보수 정치인 및 유튜버 등을 중심으로 논란이 확산됐다. 최근 투표조작 의혹을 제기한 민경욱 미래통합당 의원은 지난 1일 자신의 페이스북에서 “부정선거 탐지의 세계적인 권위자인 미국 미시간대학교 월터 미베인 교수가 한국의 21대 총선에서 조작에 의한 부정투표가 자행됐을 가능성이 있다는 내용의 논문을 발표해 충격을 주고 있다”며 해당 보고서를 소개했다. 

마찬가지로 투표조작 의혹을 밝혀내겠다며 모금운동을 펼치고 있는 가로세로연구소 강용석 변호사 또한 지난 4일 유튜브를 통해 “(해당 보고서는) 투표결과를 순수하게 통계학적으로 놓고 봤을 때 부정이 있다고 결론을 내린 것”이라며 “미 중앙정보국(CIA)의 의뢰에 의해 작성된 보고서라는 이야기가 흘러나오고 있다”고 주장했다. 

월터 미베인 교수가 지난달 29일 발표한 보고서 중 일부. 빨간색 점이 선거부정 가능성이 있는 투표소를 의미한다. 자료=정훈 와세다대 정치경제학부 교수 페이스북
월터 미베인 교수가 지난달 29일 발표한 보고서 중 일부. 빨간색 점이 선거부정 가능성이 있는 투표소를 의미한다. 자료=정훈 와세다대 정치경제학부 교수 페이스북

◇ 미베인 교수, ‘사전투표’ 오해해 잘못된 데이터 입력?

하지만 국내 정치·통계 관련 전문가들은 미베인 교수의 분석에 대해 신뢰하기 어렵다며 의문을 제기하고 있다. 미베인 교수가 한국의 정치문화와 투표 관행을 제대로 알지 못한 채 섣부른 결과를 내놨다는 것. 

국내 전문가들이 제기한 의문점을 요약하면 크게 ▲사전투표소를 별개의 분석단위로 취급해 투표율을 100% 가깝게 처리한 점 ▲분석모델의 기초가 되는 사전분포가 잘못 설정됐다는 점 등 두 가지로 압축된다. 

우선 해당 보고서에서 미베인 교수는 각 선거구가 아니라 관내사전투표, 우편투표, 국외부재자 투표 등을 별개의 분석단위로 취급했다. 이 과정에서 미베인 교수는 중앙선거관리위원회의 데이터에 따라 각 선거구별 관내사전투표의 투표율을 대부분 100%로 처리한 것으로 보인다. 

미베인 교수가 이같은 오류를 저지른 이유는 선관위의 사전투표 집계방식에 대한 이해가 부족했기 때문으로 추정된다. 투표율은 총 투표수를 전체 유권자 수로 나눠 구하지만, 사전투표의 경우 누가 투표를 하러 올지 알 수 없기 때문에 투표율을 구하는 것이 불가능하다. 따라서 선관위는 통계시스템에 사전투표일 실제 투표수와 사표를 제외한 유효표의 수만 각각 입력한다. 

예를 들어, 서울시 구로구 신도림동의 전체 유권자 수는 2만8061명, 총 투표 수는 2만749표로 투표율은 73.9%다. 하지만 신도림동의 관내사전투표 항목에는 선거인 수 6564명, 투표인 수 6564명이라고 적혀 있다. 이는 사전투표수와 유효표 수를 나타내는 것이지 이를 가지고 사전투표율이 100%라고 말할 수는 없다.

미베인 교수의 분석모델은 각 분석단위의 투표율과 득표율의 결합분포에 기초해, 특정 선거구의 당선자가 정상적인 분포에서 지나치게 벗어나는 득표율을 올린 경우 투표조작이 발생한 것으로 본다. 이러한 모델에서 사전투표소를 별개의 분석단위로 취급하면서 투표율을 100%로 잘못 입력할 경우, 해당 단위에서 선거부정이 일어났다는 ‘오해’가 발생할 수 있다. 실제 미베인 교수의 보고서에서 ‘빨간 점’으로 표시된 선거부정 투표소들은 대부분 투표율이 100%에 가까운 곳이다. 

서울대 정치외교학부 박원호 교수는 해당 보고서가 발표된 지난달 29일 자신의 페이스북을 통해 “이것(사전투표)은 물론 독립적인 ‘투표소’로 볼 수가 없니와, 투표율이 100%라고 말해서도 안된다”며 “한마디로 코딩에러, 그리고 그 결과는 전문 용어로 ‘Garbage in, Garbage out’”이라고 지적했다. 정확한 분석모델을 사용해도 잘못된 데이터를 입력하면 잘못된 결과가 도출된다는 것.

사진=박원호 서울대 정치외교학부 교수 페이스북 갈무리
국내 전문가들은 미베인 교수가 한국 정치 및 선거의 맥락을 이해하지 못하고 잘못된 결과를 도출했다고 지적하고 있다. 사진=박원호 서울대 정치외교학부 교수 페이스북 갈무리

◇ 전문가, “부정선거 가능성 50%? 잘못 설계된 모델” 

또 다른 의문은 미베인 교수의 분석모델의 기초가 되는 사전분포가 한국의 정치적 맥락을 고려하지 못한 채 설정됐다는 점이다. 미베인 교수는 선거부정 여부를 추론하기 위해 선거결과를 ▲공정선거 ▲약한 부정선거 ▲극단적 부정선거의 세 가지로 나누고 각각의 사전분포 확률을 대략 50%, 25%, 25% 수준으로 가정하고 있다. 이는 실제 데이터에 기반한 확률이 아니라, 연구자가 사전에 임의로 설정하는 값이다. 

문제는 사전분포를 어떻게 설정하느냐에 따라 분석결과가 영향을 받을 수 있다는 점이다. 특히, 전문가들은 이미 민주적 선거를 여러 차례 시행하고 다양한 감시시스템을 가동하고 있는 한국에서 부정선거의 가능성을 50%로 설정한 모델을 사용하는 것은 부적절하다고 지적하고 있다. 

서울대학교 정치외교학부 박종희 교수는 지난 4일 유튜브를 통해 “미베인의 모형은 이미 부정선거일 가능성이 약 50%라는 비현실적인 가정에 의거하고 있다”며 “이러한 사전분포의 문제, 그리고 앞서 언급된 코딩 문제 등에 대해 (미베인 교수는) 재분석 없이 단지 추측에 의거해 ‘괜찮을 것이다’라는 답변으로 일관하고 있는데, 이것은 학계에서 비판에 답하는 일반적인 태도가 아니다라고 지적했다.

월터 미베인 교수가 국내 전문가들의 의문점에 답한 이메일. 자료=정훈 와세다대 정치경제학부 교수 페이스북
월터 미베인 교수가 국내 전문가들의 의문점에 답한 이메일. 자료=정훈 와세다대 정치경제학부 교수 페이스북

◇ 미베인 교수 재반박 “사전투표소·문제, 결과에 영향 없어”

한편, 처음 미베인 교수에게 총선 결과에 대한 분석을 의뢰한 와세다대학교 정치경제학부 정훈 교수는 지난 1일 미베인 교수가 국내 전문가들이 제기한 의혹에 대해 답변한 이메일 내용을 페이스북을 통해 공개했다.

우선 미베인 교수는 사전투표소 관련 오류에 대해서는 “통계모형에서 ‘사전투표 인디케이터 변수들(prevote indicator variables)’을 통해 이미 통제·해결이 된 상태”라며 “이러한 문제는 이미 수많은 다른 선거데이터들을 분석하면서 다뤄본 적이 있다”고 자신했다. 또한 사전분포에 대한 의혹에 대해서는 “선거 포렌식 모델 개발 당시 다양한 사전분포값을 설정해 테스트를 해봤지만, 이 정도로 큰 데이터에서는 결과에 별다른 차이가 발생하지 않았다”고 답했다. 

다만, 미베인 교수의 답변은 구체적인 설명을 담고 있기 보다는 단답형으로 일관해 해명의 옳고 그름을 검증하기 어렵다. 한국개발연구원(KDI) 이인복 교수는 “미베인 교수는 자신의 분석에서 대부분의 선거 부정이 사전투표 간 발생했으며 이 중 절대다수는 표 바꿔치기가 아닌 투표율 조작을 통한 것이라고 말했다”면서 “이런데 100% 투표율을 넣고도 상향 편향(upward bias)이 없었을 것이라고 단정 짓는 모습을 보고 솔직히 조금 놀랐다”고 지적했다.

박원호 교수 또한 “더미 변수를 넣는다고 모든 문제가 사라지지 않는다”며 “문제가 있는 데이터를 더미변수를 넣는다고 괜찮다고 이야기하는 것은 어떤 경우이건 납득하기 어렵다”고 말했다. 

데이터가 크면 사전분포에 따른 결과의 차이가 크지 않다는 주장에 대한 반박도 나온다. 오하이오주립대 인지심리학 박사과정 박준석씨는 자신의 페이스북을 통해 “베이지안 분석에서 자료의 크기가 클 경우, 사전분포가 사후분포에 별 영향을 끼치지 않는다는 진술은 언제나 성립하는 진술이 아니다”라며 “사전분포에 따라 결론이 별 차이가 없을 수도 있지만, 그렇다는 것을 보일 책임은 처음 분석을 해서 결론을 내놓은 쪽에 있다”고 말했다. 

가로세로연구소 강용석 변호사는 월터 미베인 교수의 보고서를 투표 조작의 결정적 증거로 제시하고 있다. 사진=가로세로연구소 유튜브 채널 갈무리
강용석 변호사가 지난 4일 가로세로연구소 유튜브 채널을 통해 월터 미베인 교수의 보고서는 투표 조작의 결정적 증거라고 주장하고 있다. 사진=가로세로연구소 유튜브 채널 갈무리

◇ 미베인 보고서, 어디까지 믿을 수 있나?

만약 미베인 교수의 분석이 올바른 결과를 도출한 것이라고 해도, 해당 보고서를 ‘선거부정’의 근거로 내세우기는 이르다. 미베인 교수는 해당 보고서에서 “선거 포렌식 모델에 따른 ‘선거부정’이 꼭 실제 부정행위를 의미하는 것은 아니라는 점을 명심해야 한다”며 “이 모델에서 ‘선거부정’이 정상적인 정치 행위나 전략적 투표행위를 통해서도 발생할 가능성은 열려있으며 연구가 필요하다”고 말했다. 

미베인 교수는 이어 “사전투표와 선거 당일의 투표율 및 투표성향이 달라지게 만들 수 있는 요인이 있을 수 있다”며 “이로 인해 선거 포렌식 모델이 이를 ‘선거부정’으로 판단할 수 있다”고 설명했다. 즉, 미베인 교수의 분석모델에서 ‘선거부정’은 통계적으로 발견된 이상현상일 뿐이라는 것. 통계적으로 이상해보이는 결과는 실제 선거부정뿐만 아니라 해당 사회의 정치적 맥락이나 유권자의 전략적 투표에 따라서도 도출될 가능성이 있다.

게다가 미베인 교수의 보고서는 학계의 교차검증을 통해 학술지에 게재된 학술논문이 아니라 정훈 교수의 요청에 의해 공개된 보고서다. 해당 보고서를 둘러싼 의혹들은 학계 전문가들이 미베인 교수와 동일하게 ‘선거 포렌식’ 모델과 선거 데이터를 사용한 실제 분석을 수행하면 쉽게 판가름날 수 있다. 

문제는 미베인 교수와 동일한 방식으로 연구를 수행해 보고서를 검증하는 작업이 현재로서는 불가능하다는 것이다. 박원호 교수는 “논의가 좀 더 생산적이게 되는 것을 막는 이유는 미베인 교수의 연구가 닫혀있는 방식으로 제공돼서 그렇다”며 “전문 연구자들이 이분의 연구를 재현할 수가 없다. (선거 포렌식) 프로그램이 우선 잘 돌아가지 않을 뿐만 아니라, 프로그램이 무슨 짓을 하는지 알려줄 레플리케이션 코드도 공개되지 않았다”고 지적했다. 

결국, 이번 논란은 일반인이 이해하기 어려운 복잡한 통계적 분석을 거친 보고서가 학계의 검증을 거치지 않은 채 ‘투표조작을 입증하는 해외 석학의 연구’라는 이름으로 보수층에게 받아들여지면서 일어난 해프닝으로 보인다. 선거부정이라는 주장이 가지는 중대성을 고려한다면, 학계의 검증이 마무리될 때까지 해당 보고서에 대한 논의를 미루는 신중함이 필요해 보인다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 10
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
제제 2020-05-11 09:28:50
2020년 4월 15 일은 부정선거로

이땅의 민주주의가 사망한 날입니다.

부정선거에 대한 항의의 표시로

5월 19일에는 검은 넥타이를 맵시다.

넥타이부대 2020-05-11 04:19:46
넥타이부대는
까만 넥타이 매고
나와라

재검표 가자

선관위 썩었다.

임해수 2020-05-10 04:54:45
백서에 추가할 이름 임해원. 팩트체크라는 이름하에 교묘하게 진실을 가리며 정권에 부역. 부끄럽지도 않은가? 서울시내 모든 동, 심지어 경기, 인천 모든 구가 통계 범위를 넘어서는 12%이상 100% 동일 결과. 당신 자식들이 당신을 기억하도록 꼭 그 이름 남겨 드리죠.

모모 2020-05-08 18:43:58
미베인 교수가 그렇게 허술해 보이세요
ㅋㅋㅋ ㅋ

63대36 2020-05-08 17:12:21
63 대 36
이번에

민주 대 미통
대결에서
많이 나온
비율이
63 대 36 이라는 매직넘버이고

지난 대선에서
문 대 홍도

63 대 36

우연이 자꾸 반복되는 이건 뭐지?