유머천국 코하비닷컴
https://cohabe.com/sisa/182267

더 플랜: K 값이 1.5 이상이 나올 확률

모집단 20,000,000 (투표수)
표본 700,000 (미분류표 약 3.5%)
모집단의 구성비가 0.5 : 0.5 일 경우,
표본의 구성비는
기대값 (np; 700,000*0.5) = 350,000
표준편차 (√npq; √(700,000*0.5*0.5) ) = 418
을 예상할 수 있습니다.
K 값이 1.5 라는 것은 표본의 구성비가 0.6 : 0.4 라는 것을 의미합니다.
K = 표본의 구성비 / 모집단의 구성비 = (0.6 : 0.4) / (0.5 : 0.5)
다시 말해서 표본 700,000 이 420,000 : 280,000 으로 이루어진 것을 말합니다.
비유하면 동전을 700,000 번 던져서 앞면이 420,000 번 이상 나올 확률과 같습니다.
이러한 사건은 기대값이 350,000 이고 표준편차가 418 임을 생각할 때 매우 예외적인 숫자입니다.
확률값으로는 1 -  Φ { (420,000 - 350,000) / 418 } = 1 - Φ (167) 입니다.
Φ 는 표준정규분포의 누적확률분포값입니다.
엑셀에서는 1 - normdist (420000 , 350000 , 418 , true) 으로 구할 수 있습니다.
값은 0.0000000........00000000000x 입니다. (0 이 300 개 이상임.)
distribution.jpg

댓글
  • 사장 2017/04/15 08:55

    그 어려운 확률을 근혜가 해냈습니다!

    (AfX8Gy)

  • 결코다시지름 2017/04/15 09:01

    벼락을 한 30번 연속으로 맞을 확률보다 낮을듯한데요

    (AfX8Gy)

  • 미친콩 2017/04/15 09:08

    이걸 그네 머리로 했을리가 없죠. 누가 했을지 촉은 오는데 말은 못하겠고 누가 해스까???

    (AfX8Gy)

  • krondor 2017/04/15 09:13

    그런데 더플랜에 대해서 이의제기들이 있긴 합니다.
    K 값이 1이 나와야 한다는 건 [모 집단에서 완전히 랜덤하게 샘플이 채취] 되었다는 전제하에서 성립하는 건데
    미분류표가 전체 투표용지들의 랜덤 샘플인건 아니거든요.
    오히려 모집단의 특이 데이터라고 할만한 녀석들이 미분류표이니까요.
    쉽게말해 덜덜 떨리는 손으로 투표하다가 어이쿠 손이 미끄러졌네... 하는 사람들이
    박근혜 지지자들쪽에 많을까요? 아니면 문재인 지지자들 쪽에 많을까요?

    (AfX8Gy)

  • CowBoy.BK 2017/04/15 09:18

    뭔소리인지 모르겠으니 일단 베게로 보내봐야겠네요

    (AfX8Gy)

  • 써클주니 2017/04/15 09:38

    댓글에 이런저런 의견이 있으신데 더플랜 꼭보셔요

    (AfX8Gy)

  • 문태양 2017/04/15 09:55

    전국적으로 1.5가ㅡ나온 게 무서운 겁니다. 이건 아예 가능성이 거의 없는 일이니까요.

    (AfX8Gy)

  • ♡로망포르O♡ 2017/04/15 09:59

    K=1.5라는 의미는
    준비 데이터를 천만개라고 가정하고
    그중 50만개를 빼서
    950만개의 평균값과 50만개의 평균값의 비율을 말함
    이게 대체적으로 비슷하면 1에가깝고 안 비슷하면 1에서 멀어지는건데 1.5라는 의미는 50%나 차이난다는 의미임
    양자대결의 경우 1%가 바뀌면 한쪽은 줄고 한쪽은 늘게 되니까 2%차이가 남. 엄청난 차이임. 미세한 차이기 큰 차이임

    (AfX8Gy)

  • toake_ts 2017/04/15 10:09

    251개의 개표소에서 표본(미분류표)의 구성비가 모집단(개표소별 투표용지)의 구성비보다 일률적으로 1.5배 높은 것은 자연적이라할 수 없습니다. 투표지를 사람이 먼저 분류하고, 기계로 확인하고, 숫자를 집계하면 투명하고 보다 정확한 개표관리를 할 수 있습니다.

    (AfX8Gy)

  • 미르헌터 2017/04/15 10:28

    글쓴이님 고생하셨습니다
    덧붙이자면 저건 단 한개의 개표 지역에 한해서입니다
    저 어처구니 없는 일이 전국적으로 일어난것도 대단하고
    더 대단한건
    박근혜:문재인의 득표 비율에 상관없이 박근혜표가
    1.5배 더 나왔다는 거죠 ㅋㅋㅋ
    즉 박근혜가 90% 득표한 지역도 1.5
    문재인이 90% 득표한 지역도 1.5 입니다
    이게 자연적이란 얘기는 F-22 랩터가 풍화 작용을 거쳐
    만들어졌다는 거랑 동급의 얘기에요

    (AfX8Gy)

  • gesto 2017/04/15 10:47

    그냥   제로   네요.
    원숭이가 자판 때려서 소설을 지어 낼 확률도 영이 아님.
    내일 해가 서쪽에서 뜰 확률도 영이 아님.

    (AfX8Gy)

  • 개짖는소리좀 2017/04/15 10:55

    저 현상의.문제점은 실제론 무효표나 다른후보의.유효표가 1번으로 가리지않고 혼입되었을 가능성도 충분하다는 거죠
    즉 총 투표수
    미분류표 분류된 후 수개표로 재분류된 100만표
    무효표로 분류된 표
    이거 말고는 죄다 오염된 표일 가능성이 매우높다는 겁니다

    (AfX8Gy)

(AfX8Gy)