우선 예측 및 추정은 정확한 것도 아니고 설정에 따라 예측 및 추정 표수는 달라질 수 있다고 먼저 이야기하고 싶습니다. 의미를 두지 마시고 재미로 보시면 감사하겠습니다.
과거의 사례를 먼저 비추어봐야 하겠다고 봐서 시즌1, 시즌2의 사례를 먼저 분석해보겠습니다. 물론 프듀48과 비교를 하기 위해서 시즌1, 시즌2의 1~30위까지 베네핏을 제외한 3차순발식 표수를 기준으로 하였습니다.
시즌1은 전소미가 평화왕, 유일신, 생태파괴자 수준으로 치고 나갔다는 것을 알 수 있는데 상위권의 점유율이 높기 때문에 평균값 기준의 순위는 7~8위 수준으로 높다고 할 수 있습니다.
시즌2는 강다니엘/박지훈의 양강의 구도지만 대체적으로 시즌1과 비교해서 분포가 밀집이 되어 있다는 것을 확인할 수 있습니다. 평균값 기준의 순위는 14~15위라는 것을 알 수 있습니다.
이번 시즌은 시즌2에 비해서 상위권과 중위권이 표수 편차가 작은 더 밀집된 구도라고 할 수 있습니다. 우선 평균값은 산출해야 하는데 9화 기준의 중간순위에서의 총 평균값은 86,334표라는 것을 알 수 있습니다.
따라서 이번시즌이 밀집되었다는 것을 감안하면 평균값은 15~16위 수준으로 놓는 것이 적당하겠습니다. 김채원 연습생이나 조유리 연습생이 평균값에 가까울 수 있다는 것으로 가정하고 15위인 김채원 연습생을 기준으로 평균값으로 임의 설정하였습니다.
그렇게 되면 15위기준의 득표율은 2.86%로 잡을 수 있습니다. 이 득표율을 기준으로 선형보간법을(끝점의 값이 주어졌을 때 그 사이에 위치한 값을 추정하기 위하여 직선 거리에 따라 선형적으로 계산하는 방법) 이용하여 상위~중위권의 대략적인 득표율을 예상할 수 있으며 최하위인 30위의 득표율을 설정하면 중위~하위권의 대략적인 득표율을 예상할 수 있습니다.
그러면 30위인 연습생의 득표율을 어느정도로 하냐에 따라서 달라질 수 있는데 시즌2보다 간격이 촘촘하다는 것을 고려하여 1.5%정도로 득표를 했다고 가정하겠습니다.
따라서 저 위의 표를 보시면 대략적인 추정 값이 나올 수 있습니다. 물론 실제값은 정확하지 않지만 본 목적이 베네핏이 미치는 영향을 분석하는 것이기 때문에 크게 의미를 두지 마시기 바랍니다.
그리고 어제 방송이 끝나고 난 표수를 기준으로 순위가 나왔고 투표마감이 8월 18일이라는 것을 감안하면 총 표수는 더 늘어난다고 보시면 됩니다. 아마도 300만표의 2배 이상인 600~700만 표로 예상할 수 있습니다.
결론으로 말하자면 최하위권(25~30위) 연습생들은 베네핏을 받아도 탈락을 예상할 수 있습니다. 이것을 기준으로 하면 9~10만표 정도 나오고 20위 컷이 14~15만표 이상이 나와버리면 전체 1등을 해서 5만표를 가져가지 않는 이상 힘들다고 할 수 있습니다.
이를 기준으로 한다면 5만표 베네핏은 5~6계단정도의 순위에 영향을 미칠 것이고 2만표 베네핏은 2~3계단 정도의 순위에 영향을 미칠 것이라고 판단하고 있습니다.
통계에 기반 정성글 항상 잘보고 있습니다,
추천합니다
빨간색 숫자는 추정값이죠?....어떻게 추정하시는건지 궁금하네요
대단하십니다
[리플수정]살롱아무르// 네 추정값이고
평균값이 8만 6천표를 15위를 한다는 기준으로 환산하면 예측 득표율이 저리 나오게 되는데 이미 1,2위의 득표율이 나오면 2위부터 15위까지 득표율을 기준으로 중간중간의 직선거리의 간격을 이용하여 계산하는 선형보간법을 이용한 것입니다
선형보간법 적용하기가 여간 쉬운게 아닌데....대단하시네요
추천때립니다
정성글에 추천할수밖에없네요.
잘 봤습니다.
프로듀스48 관련 게시글중 가장 신뢰할 수 있는 글이 아닐까 싶습니다
역시 추천드립니다
이 표에 의하면 무라세 사에 5만 베네핏 받으면 바로 12위 데뷔 권~~?
올~~~
돛단배// 아뇨 저 추측은 300만표 기준이라 600만표 이상이면 2배가 올라가게 됩니다.
1) 재미있는 분석이네요. (재미있게 읽었으며 감사합니다. ) ^^ 분석 결과를 베네핏의 영향을 적절히 예측할 수 있다는 결론에 동의합니다. ^^ 조금더 정확한 분석을 위해 다음을 고려해 보심 어떨까요?
=> 1차 2차 순발식 득표수와 프듀의 투표성향을 볼때 중간 이상(또는 1등 -12등) 에서는 투표가 선형적으로 변하기 보다 지수적으로 변하는 경향이 있습니다. (득표율 간격이 등간격이 아니라 순위 증분에 따라 급격히 증감함.) 이에 데이터를 12등 이상에서는 지수 함수 형태로 가정하고 지수 팩터를 모델링 (그래프에서 로그-로그 함수로 그리면 선형적으로 될 것 같네요) 해서 예상 득표율을 보정하면 더욱 정확한 자료 (더욱 재미있는?) 가 되지 않을까 합니다.
2) 프듀 제작진이 베네핏 투표수의 정량화에서 통계기법을 이용해서 순위 변동에 너무 큰 영향을 주지 못하도록 조절하고 있음이 확인되고 있네요. 한편으로 정병존에는 영향이 클 것 같구요. ^^
블루애쉬// 무슨 말인줄 알겠습니다.
표수를 로그변환해서 1~12위까지 혹은 1위~15위까지 로그변환한 형태로 선형보간법으로 정리하면 지수함수의 형태가 나오더군요