유머천국 코하비닷컴
https://cohabe.com/sisa/183592

더 플랜 틀린거같음

더 플랜에 대한 말이 많아서 파파이스 141회를 1시간 8분가량 봤는데 더 봐야할 이유를 모르겠다. 혹시 내가 틀렸다면 알려주십쇼.
더 플랜에서 토론토 교수가 핵심 숫자인 1.5를 추출해낸 과정이 다음과 같다.
p(박;미분류)를 조건부 확률인 '미분류 된 표 중 박근혜의 표의 확률' 이라고 보고 p(박)을 박근혜의 표의 확률이라고 하면
{p(박;미분류)/p(문;미분류)}/{p(박)/p(문)}=약1.52
그런데 이 숫자가 전국 모든 투표소에서 볼 수 있는 현상이라고 한다. 그러니까 미분류표도 기존 투표 비율과 같이 나와서 1이 되어야 하는데 1.52로 전국적으로 동일하게 나온 것이 소름이라는 것.
그런데 김어준과 토론토 통계교수의 주장은 '미분류' 조건이 랜덤이라고 가정했을 때 성립한다. 1:08:01에 더글라스 존스 교수는 "비율이 1이 아니라는 것은 무작위가 아니라는 말인데" 라고 언급하는데 이 말이 맞다. 애초에 '미분류 투표지'는 랜덤으로 3~4퍼센트 추출해낸 것이 아니다. 기계가 '미분류'라고 표시해서 따로 뽑아낸 투표지다.
전국적으로 동일한 기계를 사용했다고 가정했을 때, '미분류'표를 뽑는 알고리즘도 동일할 것이고, 같은 알고리즘으로 수백만개를 돌렸을 때 전국적으로 당연히 동일한 비율로 미분류표를 뽑아내는게 맞다. 그러니 당연히 1:1.52가 나오지. 벼락 두 번 맞을 확률이 아니다. 내가 세차하는 날 비올 확률보다 높은거다.
'미분류' = '랜덤 추출' 이라고 하면 더 플랜의 주장이 맞다.
'미분류' = '기계가 분류해 내지 못한 표' 라고 하면 기계는 같은 실수를 반복한 것이기 때문에 죄가 없다. 따라서 더 플랜의 주장이 틀렸다. 나는 더 플랜의 주장이 틀렸다고 판단하고 뒷 부분은 그만 보기로 결정했다.
영상에 나온 통계 전문가들은 왜 저런 주장에 동조했는지 모르겠다. 내가 뭘 잘못알고있나?
아무튼 앞 부분에서 의미있는 점은 공표 전 방송이 이루어진 것이 이상하다는 것 하나. 이건 왜 그런건지 궁금하다.
PS. 미분류 확률이 3.6퍼센트나 되는 구린 개표기에 대해서도 옹호해보자면 만일 조금이라도 애매한건 미분류로 보내서 수검표 하게 하려는 의도로 분류 기준을 높게 만들었다면 어느 정도 감안할 수 있는 부분이다.

댓글
  • 페리카나양념통닭 2017/04/16 14:23

    ㅡ더플랜을 보신건가요? 파파이스를 보신건가요?

    (5U24ks)

  • 카스만 2017/04/16 14:28

    파파이스에서 더플랜 틀어주네요

    (5U24ks)

  • 0Solar0 2017/04/16 14:24

    어찌 생각이 그리 모자르는지.....

    (5U24ks)

  • 카스만 2017/04/16 14:28

    ??

    (5U24ks)

  • rnrnzhs 2017/04/16 14:26

    더 보세요.ㅎ
    표 자체를 특정인으로 100% 넣어도 다른 후보자에게 표가 갑니다.

    (5U24ks)

  • 카스만 2017/04/16 14:29

    그럼 더 봐보죠.

    (5U24ks)

  • ▶◀LeO™ 2017/04/16 14:26

    그래요 본인 생각대로 믿으세요...

    (5U24ks)

  • 카스만 2017/04/16 14:29

    믿는게 아니라 맞는거죠

    (5U24ks)

  • 페리카나양념통닭 2017/04/16 14:27

    더플랜을 보시면요....
    미분류는 기계가 판단을 보류한 표가 빠지는거고,
    정확히 판단했다고 분류된 표에서도 많은 요류가 발견됩니다.
    물론 그걸 미리 조작하여 결과를 정하는 것도 가능한걸 시연하구요.
    기계를 맹신하지말라는 겁니다.

    (5U24ks)

  • 카스만 2017/04/16 14:30

    기계를 맹신하지 않는건 맞습니다. 더 볼게요

    (5U24ks)

  • 소라토베 2017/04/16 14:28

    미분류표가 전체의 3.6% 로 나옴.
    그 중에 특정인에 대한 비율이 1.5%라는건데 그럴수가 없는거죠.
    미분류가 3.6%라는것도 이상하지만, 그게 기계가 애매한 부분이 있어서 7% 10%가 될 수는 있습니다.
    근데 그 미분류 표 중에 A라는 특정인에게 1.5%라는 비율로 표가 더 나오게 되어 있다.
    그리고 그게 전국 공통의 비율을 갖는다는게 요지입니다. 의도적으로 누군가 개입하지 않으면 이렇게 될수 없지 않나??? 하는거고요.

    (5U24ks)

  • 카스만 2017/04/16 14:31

    토론토 교수가 말한 것 처럼 조건부 확률로 계산해본거잖아요.
    미분류의 조건이 랜덤이라면 더 플랜이 맞는거고
    미분류의 조건이 기계의 오류라면, 동일한 기계가 동일한 오류를 낸 것이기 때문에 통계적으로 전국에서 같은 비율로 표가 더 나오게 되죠.
    미분류=기계에서 분류하지 못한 표 아닙니까

    (5U24ks)

  • 소라토베 2017/04/16 14:42

    음...
    "미분류=기계에서 분류하지 못한 표" 니까요 그 분류하지 못한 오차범위를 더 좁게
    예를들어서 [-----]이런 네모칸 안에 "0"표기가 된걸 분류한다고 할때 경우의 수가 단순하게
    [-0---],[0----],[---0-],[----0],[--0--]이렇게 5가지라고 상정합시다. 그리고
    [--0--]이렇게 된것만 분류하고 [-0---],[0----],[---0-],[----0]이렇게 된건 미분류로 한다고 설정을 하면 미분류 표가 더 늘어나겠죠.
    그리고 [-0---],[---0-],[--0--]이렇게 세가지 경우도 분류한다고 하면 미분류표의 %는 더 줄어들겁니다.
    위에도 말 했지만 얼마나 민감하게 미분류를 적용하느냐에 따라 미분류표의 %는 달라질 수는 있겠습니다.
    하지만 기계가 동일하게 A라는 특정인에게 표기한 표를 항상 1.5배더 많이 미분류로 분류한다면
    A라는 사람에게 투표하는 사람은 전국에서 동일하게 정확하게 가운데 못찍는다는 결론이 됩니다.
    (더 플랜에서 하는 말이 아니라 카스만님이 질문하신 내용을 설명하기위해
    아~주 단순하게 표현하자면 그렇다는겁니다)

    (5U24ks)

  • 카스만 2017/04/16 14:50

    더 단순하게 설명하자면 개표기의 작동 원리가 도장의 위치를 인식해서 분류하고, 금에 걸쳐있거나, 무효표나 애매한표는 미분류로 보내잖아요. 그런데 1번 도장의 인식률과, 2번 도장의 인식률은 기계의 실수로 달라질 수 있다는거죠. 사진사이트니까 렌즈로 얘기하자면 1번의 위치가 더 주변부니까 인식률이 떨어지고, 2번 도장은 그나마 좀 더 중앙쪽이라 인식률이 높을 수 있다는거죠. 사람의 문제가 아니라 기계의 인식률에 오류가 있을 수 있다. 그게 1.5배 정도 차이가 나더라. 그렇다면 당연히 1.5를 중심으로 표준분포가 나타나게 된다는 겁니다. 사람의 문제가 아니라 기계의 인식률 문제로요.

    (5U24ks)

  • 소라토베 2017/04/16 15:08

    그 정도 오차를 발생하는 기계면 기기 선택 전에 걸러졌어야 마땅하죠.
    또한 그 부분은 선관위에서 해명을 해야 하는거고요.
    그래서 사람이 개입될 여지가 있기때문에 여러가지를 시연합니다.
    편집되지 않은 시연은 더 많았을거고요.
    같은 기계를 사용한 시연이었잖아요? 그럼 같은기기에서 왜 그런 오차는 보이지 않았을까요?
    말씀하신 것 처럼 같은 오차율을 보여야 정상이죠...

    (5U24ks)

  • iiiliiiliii 2017/04/16 14:28

    보고도 그런소릴 하다니 범인이신가요?ㅋㅋㅋ

    (5U24ks)

  • 카스만 2017/04/16 14:31

    아뇨. 흠... 이해하기 어려운 글인가?

    (5U24ks)

  • 0Solar0 2017/04/16 14:32

    쯧쯧....

    (5U24ks)

  • 책성애자 2017/04/16 14:42

    정신병 있는 분들과 대화하시느라 힘드실 겁니다.
    위로의 말씀 전합니다.

    (5U24ks)

  • 카스만 2017/04/16 14:51

    그냥 조건부 확률과 시뮬레이션에 대해 사람들이 잘 몰라서 그런 것 같아요.

    (5U24ks)

  • 책성애자 2017/04/16 14:55

    모른다는 걸 부정하고
    새로운 걸 알려고 하지도 않죠.
    믿고 싶은 것만 믿으려는 고착된 정신은 병에 가깝습니다.

    (5U24ks)

  • kjwe300 2017/04/16 15:08

    자기소개인가요? 자게에 글쓰는거보면, 자기가 믿고 싶은것만 보고 일반화하는 글만 쓰시던데 ㅎㅎ

    (5U24ks)

  • paraparamop 2017/04/16 14:44

    김어준신자들은 이글 이해 못합니다...

    (5U24ks)

  • 허언증_확진환자 2017/04/16 14:52

    뭔가 거창하게 써놨는데..
    결론은.. "나는 다 봤지만 이해 못하고 있다."

    (5U24ks)

  • 카스만 2017/04/16 14:54

    하... 조건부 확률이 이리 어려운 개념이었군요....

    (5U24ks)

  • [⊙_⊙]원팩복근 2017/04/16 15:00

    본문의 글이 맞다는면은 애초에 선관위가 박근혜의 투표율이 많게 나오는 공정하지 못한 기계를 선정해서 개표했다는 말밖에 안됩니다.
    더플랜에서 대전제는 기계는 공정하게 분류하고 대자연의 법칙대로의 오류 정규분포를 그린다고 하는건데 님의 주장대로라면 대놓고 선관위가 부정개표용 개표기를 낙찰받아 운용했다는 말밖에 안되요.
    김어준의 더 플랜에서는 기계 자체는 공정하게 판독하는 기계를 선정했과 추후 의도적으로
    정규푼포의 mean값을 1.5로 이동시킨 조작이 소프트웨어적으로 들어갔을것이다라고 한거고요.
    님의 본문이 더플랜이 잘 못됐다고 말하고 싶은거겠지만 조금만더 생각해보면 궁극적으로 같은 얘기를 하고 있는 거에요.
    님은 기계 자체가 애초에 특정후보에게 1.5정도 편향되게 유리한 기계였단 말이고
    김어준은 공정한 기계에아가 의도적으로 조작해서 편향되게 만들었단 얘기에요.

    (5U24ks)

  • 스쿱하리우카 2017/04/16 15:07

    이분 말이 가장 정답이라고 생각 됩니다. 글쓴이 분의 말대로라면 제품의 오류가 있다는 것인데, 그럼 선관위는 그런 오류가 있는 기계를 쓴 잘못이 있는것이죠.

    (5U24ks)

  • 암드리젼트 2017/04/16 15:02

    문재인찍힌 500표 넣고 박근혜에게 몰아주는 시연보고 ㅎㄷㄷㄷ 했는데

    (5U24ks)

  • Vermeer72 2017/04/16 15:08

    '기계가 분류해 내지 못한 표'가 맞다고 하구요.
    분류하지 못한 표가 (전체 두후보의 비율보다) 특정 후보가 1.5배 많을 만한 특별한 이유가 있을 수 있나요?

    (5U24ks)

  • 보름달.. 2017/04/16 15:13

    더 플랜의 주장이나 작성자님의 주장이나 k라 하는 숫자에 대해선 모두 가능한 주장인거같아요. 그래서 궁극적으로 말하고 싶은것이 분류기는 문제가 있을 수 있으니 수검표로 하자 라는 것인지 지난 선거가 조작되었다 라는 것인지가 궁금하네요.

    (5U24ks)

(5U24ks)