[ 통계, 혼돈과 질서의 만남 ]
제 1장 불확실성, 무작위, 그리고 새로운 지식의 창조
<부록 : 토론>
A.5. π의 소숫점 숫자들은 랜덤한가?
닷지Y.Dodge는 국제통계리뷰(International Statistical Review, Vol 64, 329-344. 1966)에 발표한 논문에서, π에 대한 4,000년 역사를 추적하고 π의 소숫점 숫자들이 랜덤한 수열을 이루는지에 대해 질문하고 있습니다. 기술적으로 말해서 랜덤한 수열이란, 그 수열 자체보다 더 짧은 형태로 된 알고리즘으로는 기록할 수 없는 수열을 말합니다. 이러한 엄격한 의미로 보면, π의 소숫점 수열은 랜덤한 수열이 아닙니다. 컴퓨터를 이용하여 π의 소숫점을 구할 때, 라마누잔의 신비로운 다음 공식을 이용한다는 것은 흥미롭습니다.
그러나 π의 소숫점 숫자들은 기존의 모든 랜덤성에 대한 통계검증을 만족하므로 유사 난수로 취급할 수 있습니다. 이 숫자들은 시뮬레이션 연구에 사용될 수 있으며, 복권 추첨방식으로 만들어진 난수를 사용할 경우처럼 좋은 결과를 얻게 됩니다.
<표1-4>는 π의 소숫점 1,000개**를 순서대로 나열한 것입니다. 1,000개의 소숫점 숫자 중 숫자 0,1,…,9의 빈도수는 다음과 같습니다.
관측도수가 기대도수로부터 벗어난 정도를 검정하는 카이제곱 통계량은 <표4.2>로써(자유도는 9) 작은 값이며, 이는 각 숫자의 빈도가 기대도수에 적합하다는 것을 반영하는 것입니다. 또 다른 검정으로 π의 소숫점 숫자를 5개씩 짝지어 이중에 포함된 홀수의 빈도를 이용할 수 있습니다.
이 경우에 기대도수에 대한 적합도를 검정하는 카이제곱 통계량은 4.336(자유도는 5)으로 역시 작은 값입니다. π의 소숫점 숫자열은 <표1-1>과 <표1-2>에 서술된 흰색과 검은 색 구슬의 배열 및 새로 출생하는 남녀 어린이의 배열 과 같은 성격을 갖는 것으로 볼 수 있습니다. (http://⁷ 2.1 난수에 관한 책!(2)/ 참조)
** 12세 중국소년 장 추오는 25분30초만에 π의 소숫점 숫자 4,000개를 외웠다고 보고되었다.