[ 통계, 혼돈과 질서의 만남 ]
2. 무작위와 난수
① 이상하게도 불확실성을 연구하는 방법론은 무작위로 배열된 숫자들을 사용합니다. 여기서 무작위로 배열된 숫자들이란, 0,1,…,9의 숫자가 씌어진 10개의 동전들을 주머니에 넣은 후, 한 개의 동전을 끄집어내고 다시 그 동전을 주머니에 집어넣고 흔든 다음 또 다른 동전을 끄집어낼 때 얻어지는 수의 열과 같은 것입니다.
난수(Random numbers)라고 불리는 이러한 수열은, 이미 추출된 숫자들을 가지고 다음 번에 추출될 숫자를 예상할 수 없다는 점에서 불확실성 (무질서 또는 엔트로피)을 최대한 반영하고 있다고 볼 수 있습니다. 이러한 난 수를 어떻게 생성하는지, 그리고 특정 조사연구나 복잡한 계산들이 수반되는 문제를 푸는데 이 난수가 얼마나 필요 불가결한 것인지 알아보도록 합시다.
2.1 난수에 관한 책!
1929년 티펫L.H.C. Tippett이라는 통계학자가 “무작위 추출 숫자들Random Sampling Numbers”이라는 책을 출판하였습니다. 이 책에 포함된 숫자는 41,600개(0에서 9까지의 정수)인데, 4개의 숫자를 하나의 세트로 하여 여러 개의 세로배열을 한 것으로 26페이지로 구성되어 있습니다.
저자는 영국의 인 구조사통계표에 있는 행정교구 지역들의 인구수를 이용하여 각 지역의 숫자에 서 처음 두 자리와 나중 두 자리를 생략한 다음, 이 생략한 숫자들을 41,600 개의 숫자가 얻어질 때까지 여러 가지 방법으로 차례로 접속시키는 방법을 사 용하였습니다. 단지 되는 대로 숫자를 모아 놓은 것에 불과한 이 책은 전문서적 중 베스트셀러가 되었습니다.
그 후, 위대한 통계학자인 피셔R.A.Fisher와 예이츠F.G.Yates가 또 다른 책을 출판하였는데, 이것은 20단위 대수표에서 15~19 자리 숫자들을 나열하는 방식으로 15,000개 숫자들을 배열한 것입니다. 난수에 관한 책!
이것은 사실도 허구도 아닌 단지 의미 없는 숫자들을 되는 대 로 모아 놓은 것에 불과한 것입니다. 도대체 이것을 무엇에 쓸 수 있겠습니까?
과학자들이 왜 이것에 관심을 가집니까? 만약 이것이 이전 세기에 출판되었더라면 과학자들과 문외한들은 반발했을지도 모릅니다. 그러나 이 난수에 관한 책은 실존세계의 문제를 해결하기 위한 필요로부터 생산된 20세기의 대표적 발명품입니다.
이제 난수생산은 상당한 연구와 정교하고도 빠른 컴퓨터들을 필요로 하는 수십억 달러의 사업이 되었습니다. 난수열이란 무엇입니까? 이것은 이전에 언급한 것처럼 어떤 특정한 패턴을 따르지 않는다는 것을 제외하고는 이렇다할 만한 정의가 없습니다. 그러면 사람들은 어떻게 숫자들을 그처럼 이상적으로 배열할 수 있겠습니까? 예를 들어 동전을 여러 차례 던져서 다음과 같이 앞면이 나오면 1을 기록하고 뒷면이 나오면 0을 기록합시다.
여러분들이 동전을 던질 때마다 매번 결과를 조작할 수 있는 마술사가 아닌 한, 여러분들은 이른바 이진수(0 혹은 1)가 불규칙적으로 배열된 결과를 얻게 됩니다. 이러한 수열은 검은 구슬과 흰 구슬이 같은 수만큼 들어간 주머니에서 구슬을 꺼내는 방법으로도 얻을 수 있습니다.
제가 인도통계연구원에서 1학년들을 가르칠 때, 학생들을 켈커타에 있는 연구원 근처의 본-훌리 Bon-Hooghly 병원에 보내 일련의 남녀 아기들의 출생을 기록하도록 하였습니다. 사내아이의 경우 1을 여자아이의 경우 0을 기재함으로써, 동전을 계속 하여 던지거나 구슬을 반복하여 끄집어내는 경우에 얻어지는 것과 같은 일련의 이진수를 얻을 수 있었습니다. 하나는 생물학적 현상으로부터 얻어진 자연스런 수열이며, 다른 것은 인위적으로 생산된 것입니다.
(다음편에 ‘무작위와 난수’ 계속)