제가 일요일과 조금 전까지 한 편의 글도 쓰지 않은 것은 선관위와 해당 여론조사기관의 홈페이지에 들어가 안철수가 문재인을 추월했거나 오차범위 내의 초접전으로 나온 것이 제대로 된 여론조사 기법을 사용했는지 확인하기 위해서였습니다. 저를 비롯한 수많은 사람들의 비판에 직면했던 JTBC 뉴스룸에서도 이에 대해서도 다루었습니다(비판의 효과가 있었다!). 여론조사의 핵심인 '샘플링'의 세계적인 권위자 김재광 아이오와주립대 교수와의 인터뷰를 통해 무엇이 문제인지 다룸으로써 비판 여론을 피해갔습니다.
문제가 됐던 내일신문이 의뢰하고, 디 오피니언이 진행한 여론조사의 경우 유선전화와 자체 개발한 엡(인터넷 조사)을 사용했는데, 직전까지의 여론조사에서는 사용하지 않은 것이라 그 신뢰성이 전혀 검증되지 않은 방식이 문제였습니다. 그들의 주장은 패널들의 응답률이 너무 낮아 여론조사로써의 가치가 없기 때문에 이를 높이기 위해 '유효성 시스템'이 적용된 엡이라 문제가 없다는 것입니다. 이 때문인지 70% 정도였던 유효하지 않은 응답률이 7%대로 떨어지는 사상 초유의 성공(?)을 거두었습니다.
헌데 여론조사의 혁명을 불러올 해당 엡을 다운받아 설치한 패널이 전체의 3.3%에 불과했습니다. 이 정도의 표본수라면 여론조사로써 아무런 신뢰성을 가질 수 없습니다. 샘플이 이렇게까지 적으면 아무리 많은 보정 프로그램을 돌려도 전국민을 대신할 여론조사는 나올 수 없습니다. 엡을 다운한 3.3%의 패널이 자발적으로 했다면 그들의 이념성향이 제대로 반영됐는지, 연령별, 지역별, 계층별, 성별 분포가 제대로 이루어졌는지 신뢰할 수 없습니다. 문재인을 반대하는 패널들이 주로 다운받았는지 어떻게 알 수 있겠습니까?
안철수와 문재인의 양자대결을 억지로라도 만들기 위해 후보들을 한 명씩 제거해나가는 질문들로 악의적인 왜곡의 위험성이 너무 높았습니다. 지지율이 높은 만큼 비호감도 높은 문재인에게 절대적으로 불리하게 유도된 이런 질문의 흐름들은 존재하지도 않는 가상대결을 만들 뿐만 아니라, 본격적인 검증을 받지 않아 비호감도 낮을 수밖에 없는 안철수에게 일방적으로 유리합니다. 명백한 조작질이라고 할 수밖에 없습니다.
그들이 주장하는 '유효성 시스템'의 알고리즘이 어떻게 되는지 밝혀야 하며, 모든 여론조사의 신뢰성을 가늠하는 로우데이타를 오픈해야 합니다. 그래야 70% 대였던 유효하지 않은 응답률(비적격)이 7% 대로 떨어지는 사상 초유의 성공을 거두었는지 확인할 수 있습니다. 유효하지 않은 응답률을 이 정도까지 낮출 수 있다면 전 세계 모든 여론조사기관들은 이들이 개발한 엡을 어마어마한 가격을 주고서라도 구입해야 앞으로의 신뢰성을 유지할 수 있습니다.
초인공지능을 통해 그 동안 구축된 모든 빅데이터를 완벽하게 분석하지 않았다면 이런 정도에 이를 수 없는 것이 현실이기 때문에, 다른 말로 하면 최소 2000% 대의 슈퍼울트라 뻥일 가능성이 높습니다. 후보등록이 이루어지는 후에는 여론조사를 공표할 수 없기 때문에 안철수가 문재인을 추월했다는 골든크로스 현상을 고의로 만들었을 가능성이 매우 높습니다. 민주당이 해당 여론조사기관을 고발한 것은 이들의 여론조사가 범죄에 해당할 수 있기 때문에 당연한 대응입니다.
저는 다른 여론조사들도 상당한 의구심을 가질 수밖에 없었습니다. 이제는 거의 무용지물이 되다시피한 유선전화 비율이 높은 것으로도 부족해 무선조사도 확률적으로 나올 수 없는 특정 국번(만개 중에서 60개에 집중된 KBS-연합뉴스가 의뢰한 리서치코리아 조사로 이제는 폐기된 방식. 그 전에는 7~8천개의 국번을 사용해서 무작위로 함)에 집중된 것, 패널에 대한 면접조사가 거의 이루어지지 않은 것, 응답율이 너무 낮은 것처럼 여론조사의 신뢰성을 좌지우지하는 요소들이 모두 다 형편없었습니다.
아무리 좋게 봐도 여론조작이 아니면 이런 결과가 나올 수 없습니다. 2월까지의 여론조사와 3~4월의 여론조사가 이렇게까지 틀린 것도 있을 수 없는 일입니다. 가장 유명한 말은 '쓰레기를 넣으면 쓰레기가 나온다'는 것인데, 모집단을 선정하는 샘플링부터 특정 국번에 응답자가 몰려있는 것까지 모든 로우데이터가 도저히 이해할 수 없도록 형편없거나 확인할 방법도 알려주지 않은 이들의 여론조사를 믿을 바에야 김정은이나 트럼프의 말을 믿겠습니다.
우리나라는 로우데이타를 신뢰성 있게 구축하기 위한 초기작업이 너무나 형편없는 것은 상식도 되지 못합니다. 지난 총선에서 여론조사기관들이 완전히 죽을 쓴 이유가 여기에 있으며, 선관위가 이를 극복하고자 통신사와 손잡고 '안심번호'를 따로 모집한 것도 이 때문입니다. '안심번호'는 통신사의 빅데이터를 활용해 여론조사의 모든 요소들이 골고루 반영해 샘플링한 번호들로, 이것에 기초해서 이루어진 여론조사는 지난 총선의 결과와 거의 일치했었습니다.
하지만 여론조사 전문가에게 '안심번호'에 대해 문의했더니, 셀 수 없을 만큼 많은 각종 변수와 여론환경(이념분포 같은 것)처럼 근본적인 변화에 따라 유권자의 선택이 달라지는데 '안심번호'가 이를 따라가는 지속적인 업데이트가 이루어지지 않는다면 신뢰성은 계속해서 추락할 것이라고 했습니다. 여론조사가 이처럼 힘들어진 것은 기술과 삶의 변화에 따른 것이라 어쩔 수 없는 일이지만, 그나마 신뢰성을 담보할 수 있는 것들도 지키지 않은 여론조사를 등록·보도하는 것은 범죄라고 할 수 있습니다.
우리의 여론조사가 얼마나 개판인지 말해주는 대표적인 것이 '출구조사'입니다. 여론조사 선진국에서는 투표소에서 100m 이상 떨어진 곳에서 투표하러 가는 사람에게 영향을 미치지 않도록 조사하는데, 우리의 경우는 투표소에서 나오자마자 투표하지 않은 사람에게 다 들리도록 출구조사를 합니다. 여론조사에 흔들리듯이, 투표를 목전에 두고 있을 때 타인의 선택은 유권자에게 영향을 미침에도 이런 것조차 지키지 않는 것입니다.
당선가능성에서는 문재인이 압도적으로 높게 나오는 것처럼, 후보 등록 이전에 안철수의 지지율을 최대한 띠우고 문재인을 죽이기 위해 진행된 것으로 보이기에 지난주 여론조사와 언론들의 일치된 행태는 무시하시되, 대선이 끝난 이후의 후보별 득표율과 비교해서 엄청난 차이를 보이는 여론조사기관들은 사법조치하는 것이 필요해 보입니다. 대한민국이 헬조선이 된 것은 이처럼 유권자를 조작과 동원의 대상으로만 여기는 기득권의 일치된 이익공동체 때문인데, '빨리 빨리'의 폐해인 단기기억상실증까지 더해지면 선거 때마다 벌어지는 민심왜곡을 막지 못합니다.
이번 선거는 분노한 시민들의 촛불혁명이 만들어냈고, 5개월 이상의 촛불집회를 관통해온 것이 적폐청산과 국가개조였다면 시민혁명이 정치혁명을 넘어 선거혁명까지 이어질 때 비로소 실현가능성이 손에 잡히는 구체적인 현실로 다가옵니다. 문재인의 승리도 중요하지만, 70년 적폐를 청산하고 완전히 새로운 대한민국을 만들려면 문재인 이후의 집권도 중요합니다. 안희정과 이재명 등도 이런 여론환경에서는 승리에 이르는 길이 가시밭길일 수밖에 없습니다.
지난 이틀 동안 선과위와 여론조사기관들의 홈페이지를 대단히 러프하고 접근할 수 있는 데이타 한계 내에서 살펴봤지만, 제가 내린 결론은 정권교체와 적폐청산이란 촛불민심의 대세에는 큰 변화가 없다는 것입니다. 기성언론과 여론조사기관들이 어떤 왜곡과 공작을 벌이던 승리에 대한 확신을 투표로 표출하는 것만 분명히한다면, 세계 민주주의 혁명사에 새로운 장을 여는 것은 의문의 여지가 없다고 확언할 수 있습니다.
국민주권을 명시한 헌법 제1조는 '자유위임의 법리'를 따르느냐, '명령적 위임의 법리'를 따르느냐에 따라 정치엘리트 위주의 대의민주주의와 시민주권의 강화를 뜻하는 참여와 직접민주주의로 구별됩니다. 촛불혁명이 시민주권을 향한 위대한 여정이라면 이번 선거는 시민과의 소통과 합의를 당연시여기는 후보에게 표를 주어야 합니다. 압도적인 정권교체만이 70년 적폐를 청산하는 두 번째 단계라면 다른 말이 필요없을 듯합니다. 깨어있는 시민들의 행동하는 양심만이 탈조선의 꿈을 이룹니다.
사진
일희일비하기에는 일하기도 바쁘다보니...
좋은 글 감사합니다.
Electroneering 이 가능한 선거라니... 공정성은 엿 먹으라고 하는 선거네요. 외국에서 선거 참관 하는 사람으로서 기가 막힙니다.
좋은글 감사합니다
저들이 노리는 것은 공중파, 종편 시청자들.
정치에 관심이 덜한 분들께
반드시 한 두번은 적극적으로 설명해드려야
할 사항입니다.
"그런거야? 어쩐 지 이상하더라" 란
대답을 세분께 받았습니다.
선관위가 딱 사용할 예문을 정해주고
괄호만 쳐서 거기 후보 이름만 쓸수잇게 선거조사용 예문을 확실하게 예를 100개 정도 만들어 주면 되는데
안하지.