수정했습니다. 역시나 중학교 수준 확률 계산을 잘 못했습니다.
좀 민망하네요. 어디가서 이공계란 소리 안하고 다니겠어요.
---------------------------------
순수하게 수학적인 확률 모델로 계산해 보고 싶었음.
1등 확률:
45개의 숫자에서 6개의 번호를 뽑는 가지수
= (45 * 44 * 43 * 42 * 41 *40) / (6*5*4*3*2*1) = 8,145,060==> 8백만 가지.
사람들이 사는 숫자의 distribution이 uniform하다고 가정.
(즉 최대한 겹치는 번호를 안 산다고 가정)
이하 판매 자료는 국민은행 홈페이지에서 얻어옴.
238회 (07년 6월 23일)
: 총 판매액 42,952,477,000 (원) (4백20억원) ==> 커버하는 가지수 42,952,477 (개)
==> 1등수 기대값 : 42,952,477 / 5,864,443,200 ==> 5.27
실제 1등 당첨자수 : 9명
마찬 가지로 이하 10회를 계산해 보면
237회; 판매액 43,358,287,000 (원) ==> 1등 발생 기대값 5.32 => 1등 당첨자수 7명
236회; 판매액 42,941,871,000 (원) ==> 1등 발생 기대값 5.27=> 1등 당첨자수 2명
235회; 판매액 43,347,391,000 (원) ==> 1등 발생 기대값 5.32=> 1등 당첨자수 3명
234회; 판매액 42,814,085,000 (원) ==> 1등 발생 기대값 5.27 => 1등 당첨자수 4명
233회; 판매액 43,516,805,000 (원) ==> 1등 발생 기대값 5.25 => 1등 당첨자수 10명
232회; 판매액 43,564,632,000 (원) ==> 1등 발생 기대값 5.34=> 1등 당첨자수 9명
231회; 판매액 42,355,627,000 (원) ==> 1등 발생 기대값 5.34 => 1등 당첨자수 9명
230회; 판매액 44,191,351,000 (원) ==> 1등 발생 기대값 5.2 => 1등 당첨자수 8명
229회; 판매액 44,762,989,000 (원) ==> 1등 발생 기대값 5.42 => 1등 당첨자수 7명.
......
이 계산에 따르면 바꿔서 이야기 하면 1등이 한명도 나오지 않을 확률이 99.993% 인데,
지난 10주 (사실은 수십주 동안) 1등은 1명 이상 나왔을 뿐더러, 평균 6.8명의 당첨자가 나오고 있다.
==> 지난 10주간 평균 6.8명의 당첨자가 나웠다. 평균 기대값 5.3에 비하면 약간 높은 수준이지만 의미있어 보이지는 않는다.
통계의 범위를 100주 정도로 넓게 잡고, 다른 분석을 해봐야 의미있는 데이터가 나올 것임.
수학적으로 내릴수 있는 결론은
1) 내 계산이 잘못되었다.
--> 검산을 부탁드림. 그런데 중학교 수준의 확률 이론을 적용해도 이건 좀 이상함.
==> 정답. 중학교 수준 확률을 다시 배워야 함. 어디가서 이공계란 소리 안하고 다니겠음.
2) 데이터가 틀리다
--> 국민은행 홈페이지가 잘못되었을 수 있다. 이를테면 판매액이 원 단위가 아니라 1000원 단위라던지. 근데 1등이 보통 100억원을 10명이 나눠가진다고 하니, 판매액 400억원이 틀린 데이터 같지 않음. (판매액에서 5등을 제외한 나머지 금액의 60%를 1등이 나눠 먹는다고 되어있음.)
==> 데이터는 맞았음.
3) 당첨 확률 혹은 당첨자 숫자에 조작이 있다.
==> 커다란 조작이 있을 확률은 적어보임. 적어도 수학적으로는.
4) 대한민국은 기적의 공화국이라 0.007의 기적이 매주 이어지고 있다. 참고로 0.007가 10번 이어질 확률은 0.000000000000000000022 정도 되는것 같다. (공을 한두개 더썼던지 덜썼던지. 2.82 * 10^-22임)
===> 그럴리가.
* 그래도 나는 매주 로또를 산다. 거짓으로라도 로또 당첨자를 만들기 위해서라면 몇몇 사람에게 돈을 줄텐데... 거기에 내가 걸릴 확률도 있는게 아닐까?
===> 역시 로또 뿐이다. 매주 사야지.