모집단 20,000,000 (투표수)
표본 700,000 (미분류표 약 3.5%)
모집단의 구성비가 0.5 : 0.5 일 경우,
표본의 구성비는
기대값 (np; 700,000*0.5) = 350,000
표준편차 (√npq; √(700,000*0.5*0.5) ) = 418
을 예상할 수 있습니다.
K 값이 1.5 라는 것은 표본의 구성비가 0.6 : 0.4 라는 것을 의미합니다.
K = 표본의 구성비 / 모집단의 구성비 = (0.6 : 0.4) / (0.5 : 0.5)
다시 말해서 표본 700,000 이 420,000 : 280,000 으로 이루어진 것을 말합니다.
비유하면 동전을 700,000 번 던져서 앞면이 420,000 번 이상 나올 확률과 같습니다.
이러한 사건은 기대값이 350,000 이고 표준편차가 418 임을 생각할 때 매우 예외적인 숫자입니다.
확률값으로는 1 - Φ { (420,000 - 350,000) / 418 } = 1 - Φ (167) 입니다.
Φ 는 표준정규분포의 누적확률분포값입니다.
엑셀에서는 1 - normdist (420000 , 350000 , 418 , true) 으로 구할 수 있습니다.
값은 0.0000000........00000000000x 입니다. (0 이 300 개 이상임.)
https://cohabe.com/sisa/182267
더 플랜: K 값이 1.5 이상이 나올 확률
- 경주 유채밭에서 사진찍는데 별미친... [20]
- 밴드마스타 | 2017/04/15 10:39 | 2365
- 더 플랜: K 값이 1.5 이상이 나올 확률 [12]
- toake_ts | 2017/04/15 10:38 | 2345
- 더 플랜 보다가 갑자기 생각난 18대 대선 YTN [5]
- Wellmade | 2017/04/15 10:36 | 2309
- 시그마18-35 ufo렌즈 흔글면소리나나요? 동영상있습니다 [9]
- 캬캬캬쿄쿄쿄 | 2017/04/15 10:34 | 5290
- SNL ) 모든걸 다 가진 남친.jpg [18]
- 빠빠빠! 빠워!!! | 2017/04/15 10:34 | 3690
- 전 안철수캠프이던 이범이 어제 학제개편 비판을 직접적으로 한 이유가 있더군요. [7]
- ♥서비♥ | 2017/04/15 10:34 | 3232
- 히키 백수 니트녀 [27]
- 후미카 | 2017/04/15 10:33 | 5278
- 위기가 곧 기회다 [12]
- 도사 | 2017/04/15 10:33 | 4627
- 더플랜은 언론에서 공론화시키게끔 만들어야합니다 [7]
- 마이콜리 | 2017/04/15 10:32 | 5375
- 알프레드, 문단속 잘했어야죠. [16]
- 하나요는정말사랑스러워 | 2017/04/15 10:32 | 5376
- 압도적인 지지를 부탁한 것이 이해가 됩니다. [1]
- 프리스트리퍼 | 2017/04/15 10:32 | 3836
- [팩폭주의] 현존하는 제일 끔찍한 혼종.jpg [35]
- 그건아니지이사람아 | 2017/04/15 10:28 | 4551
- 유전무죄 무전유죄... [9]
- 오빠두줄 | 2017/04/15 10:25 | 3122
- 지난 2주간 안철수 지지자의 주요 가치관 변화.jpg [94]
- 불펜대통령 | 2017/04/15 10:19 | 3359
그 어려운 확률을 근혜가 해냈습니다!
벼락을 한 30번 연속으로 맞을 확률보다 낮을듯한데요
이걸 그네 머리로 했을리가 없죠. 누가 했을지 촉은 오는데 말은 못하겠고 누가 해스까???
그런데 더플랜에 대해서 이의제기들이 있긴 합니다.
K 값이 1이 나와야 한다는 건 [모 집단에서 완전히 랜덤하게 샘플이 채취] 되었다는 전제하에서 성립하는 건데
미분류표가 전체 투표용지들의 랜덤 샘플인건 아니거든요.
오히려 모집단의 특이 데이터라고 할만한 녀석들이 미분류표이니까요.
쉽게말해 덜덜 떨리는 손으로 투표하다가 어이쿠 손이 미끄러졌네... 하는 사람들이
박근혜 지지자들쪽에 많을까요? 아니면 문재인 지지자들 쪽에 많을까요?
뭔소리인지 모르겠으니 일단 베게로 보내봐야겠네요
댓글에 이런저런 의견이 있으신데 더플랜 꼭보셔요
전국적으로 1.5가ㅡ나온 게 무서운 겁니다. 이건 아예 가능성이 거의 없는 일이니까요.
K=1.5라는 의미는
준비 데이터를 천만개라고 가정하고
그중 50만개를 빼서
950만개의 평균값과 50만개의 평균값의 비율을 말함
이게 대체적으로 비슷하면 1에가깝고 안 비슷하면 1에서 멀어지는건데 1.5라는 의미는 50%나 차이난다는 의미임
양자대결의 경우 1%가 바뀌면 한쪽은 줄고 한쪽은 늘게 되니까 2%차이가 남. 엄청난 차이임. 미세한 차이기 큰 차이임
251개의 개표소에서 표본(미분류표)의 구성비가 모집단(개표소별 투표용지)의 구성비보다 일률적으로 1.5배 높은 것은 자연적이라할 수 없습니다. 투표지를 사람이 먼저 분류하고, 기계로 확인하고, 숫자를 집계하면 투명하고 보다 정확한 개표관리를 할 수 있습니다.
글쓴이님 고생하셨습니다
덧붙이자면 저건 단 한개의 개표 지역에 한해서입니다
저 어처구니 없는 일이 전국적으로 일어난것도 대단하고
더 대단한건
박근혜:문재인의 득표 비율에 상관없이 박근혜표가
1.5배 더 나왔다는 거죠 ㅋㅋㅋ
즉 박근혜가 90% 득표한 지역도 1.5
문재인이 90% 득표한 지역도 1.5 입니다
이게 자연적이란 얘기는 F-22 랩터가 풍화 작용을 거쳐
만들어졌다는 거랑 동급의 얘기에요
그냥 제로 네요.
원숭이가 자판 때려서 소설을 지어 낼 확률도 영이 아님.
내일 해가 서쪽에서 뜰 확률도 영이 아님.
저 현상의.문제점은 실제론 무효표나 다른후보의.유효표가 1번으로 가리지않고 혼입되었을 가능성도 충분하다는 거죠
즉 총 투표수
미분류표 분류된 후 수개표로 재분류된 100만표
무효표로 분류된 표
이거 말고는 죄다 오염된 표일 가능성이 매우높다는 겁니다