Skip links

⁹ 2.3 표본조사

[ 통계, 혼돈과 질서의 만남 ]

2. 무작위와 난수
2.3 표본조사

아마도 난수들의 가장 중요한 용도는 표본조사나 실험작업을 할 때 자료를 만드는 데 있을 것입니다. 수많은 개인들로 구성된 커다란 모집단에서 평균소득을 알고자 한다고 가정합시다.

각 개인들 모두에게서 정보를 얻어 자료를 처리하거나 완벽하게 계수를 하는 것은 시간과 금전적인 면에 있어서 큰 낭비일 뿐 아니라 정확한 자료를 얻기 위한 조직 구성상에도 어려움이 있기 때문에 적절한 방법이 되지 못합니다. 반면 표본을 추출하여 소규모의 개인집단에 관한 자료를 수집할 경우 신속하게 결과를 얻을 수 있을 뿐만 아니라 일정한 조건하에서는 자료의 정확도도 보증할 수 있습니다.

그러면 평균소득에 관한 정당하고도 정확한 추정치를 얻기 위하여 어떻게 표본을 추출해야 할까요? 한가지 방법은 난수들을 이용한 간단한 추첨방법입니다. 즉, 각 개인들에게 1,2,…,N의 숫자를 부여한 후, 1과 N사이의 난수 중 일정한 개수를 추출한 다음, 이 난수 들에 해당되는 개인들을 선택하는 것입니다. 이 방법은 단순 무작위 표본추출이라 불립니다.

통계이론에 의하면 표본의 크기가 증가할수록 확률표본에 속 한 개인들의 평균소득은 참값에 근접한다는 것입니다. 실제로 표본크기는 원하는 정밀도에 따라 결정될 수 있습니다.

2.4 실험설계

무작위Randomization는 과학적 실험에서 중요한 요소입니다. 즉, 어떤 질병을 치료하기 위하여 A약품과 B약품 중 어떤 것이 더 좋은가를 실험하는 경우나, 주어진 여러 가지 볍씨 중 어떤 종류가 수확량이 더 많은가를 결정하는 실험 같은 경우 무작위는 중요한 역할을 합니다.

이러한 실험들의 목적은 처리들의 정당한 비교를 가능케 하는 자료들을 생성하는 데 있습니다. 실험설계 분야의 개척자인 통계학자 피셔R.A.Fisher는 의약실험에서 약품A와 약품B에 무작위로 개인들을 할당하고 실험용 경작지에 여러 종류의 볍씨 들을 무작위로 할당하여 재배함으로써, 처리들 사이의 비교를 위한 정당한 자료를 얻을 수 있다는 것을 보였습니다.

2.5 메세지의 암호화

많은 양의 난수들은 암호작성술이나 송수신되는 메시지의 비밀코드에 사용될 뿐만 아니라 개인의 은행거래 비밀을 유지하기 위하여도 이용됩니다. 비밀이 극도로 요구되는 중요한 외교 및 군사통신은 암호화되는데, 만약 이 암호가 불법으로 도청될 경우 도청당사자는 단지 무작위로 나열해 놓은 숫자들만을 얻게 됩니다. 그 방법은 다음과 같습니다.

우선 송신자와 수신자만이 알고 있는 기준기호열이라 불리는 일련의 무작위 이진수들을 만들어냅니다. 송신자는 그의 메시지를 각 문자별로 표준 8비트 컴퓨터 코드로 전환함으로써 일련의 2진수로 바꿉니다(예를 들면 문자 a는 0110 0001 처럼). 그 다음 기준기호 열 밑에 이 메시지기호열을 놓습니다. 기준기호열이 1인 곳의 메시지기호열은 숫자를 바꾸고, 기준기호열이 0인 곳의 메시지기호열은 그대로 둠으로써 코드 기호열을 만듭니다.

최종적으로 무작위로 나열한 것처럼 보이는 일련의 2진수 코드기호열을 보내면 수신자는 이미 알고 있는 기준기호열을 이용하여 같은 방법으로 변환시킴으로써 메시지를 해독할 수 있습니다. 그 변환과정은 다음과 같습니다.

은행들은 자동인출기를 통해 이루어지는 거래들의 비밀을 보장하기 위하여 난수들을 이용한 비밀코드를 사용합니다. 이러한 목적을 위하여 난수로 기준기호열을 만드는데, 일정법칙에 따라 메시지는 코드로 바뀌고 이것은 오직 기준기호열로 해독할 수 있는 것입니다. 결국 기준기호열이 중앙컴퓨터와 자동 인출기 사이에 동시에 주어짐으로써, 이 두 장치들은 도청의 두려움 없이 자유로이 통신할 수 있는 것입니다. 중앙컴퓨터는 자동인출기로부터 고객번호와 고객이 원하는 인출금에 관한 메시지를 전달받은 후, 고객의 계좌를 확인하고 지불여부를 자동인출기에 통보하는 것입니다.

2.6 모형구축 도구로서의 난수

통계적 문제들을 해결하기 위하여 초기에 난수들을 응용함으로써 모형구축 및 예측작업에서 난수들이 사용될 수 있는 기반이 마련되었습니다. 이러한 모형들이 개발된 분야는 일기예보, 소비재의 수요, 그리고 주택, 학교, 병원, 운수장비 등 서비스분야의 사회적 수요 등입니다.

맨델브롯Mandelbrot(1982) 은 한 나라의 불규칙적 해안선이나 또는 사물의 형상과 같은 복잡하고 정교한 곡선들의 모형을 만들기 위하여 난수들을 성공적으로 사용하였습니다.

2.7 복잡한 문제들을 풀 경우

난수발생기들에 관한 수많은 수요를 있게 한 또 다른 난수의 이용은 순회 판매원의 문제와 같은 복잡한 문제를 해결하는 것입니다. 즉, 방문해야 할 수많은 장소가 있을 때, 주어진 장소에서 출발하여 같은 장소로 되돌아올 경우에 최단거리를 결정하는 문제입니다.

또 다른 흥미로운 예는 체스게임의 프로그램을 작성하는 것입니다. 비록 체스는 완벽한 정보를 요구하는 게임이지만, 인공지능 프로그램들은 게임이 매우 복잡해지는 것을 피하기 위하여 때때로 우연성에 의한 움직임을 기억장치에 짜 넣습니다. 이처럼 난수와 우연성의 개념은 그 이용범위가 끝이 없는 것 같습니다 (다음 편에 계속)