[ 통계, 혼돈과 질서의 만남 ]
제 2장 불확실성 길들이기 : 통계학의 발전
2.1 논리적 추론의 세 가지 유형
2.1.3 위기관리를 위한 논리방정식
획기적 변화가 온 것은 20세기 초반이었습니다. 앞에서 설명하였듯이 특정한 결과를 일반화한 법칙으로 창조된 지식은 불확실성을 내포하고 있지만, 그 속에 담긴 불확실성을 계량화한다면 종류가 다르긴 하지만 확실한(불확실성이 제거된) 지식이 된다는 것이 인식되었습니다. 이러한 새로운 패러다임은 다음의 논리방정식으로 표현됩니다.
이것은 철학의 문제가 아닙니다. 이것은 새로운 사유방식입니다. 이것은 위기 관리를 효율적으로 할 수 있게 해주며, 인간을 예언가나 점술가에 의지하지 않도록 해주는 기본적인 방정식입니다. 이것이야말로 다른 대책이 없을 때 의사 결정을 합리적으로 함으로써 현재가 미래를 설명하도록 합니다.
최적화한 의사결정으로 형식화된 문제는 이제 연역적 추론으로 해결할 수 있습니다. 이처럼 귀납적 추론은 연역적 논리방식의 영역 안으로 가져올 수 있습니다.
예를 들어 오늘날 일기예보가 어떤 형태로 이루어지는지 살펴봅시다. 전에는 일기예보를 할 때, ‘내일 비가 올 것이다’ 또는 ‘내일 비가 오지 않을 것이다’와 같이 단언적인 서술방식을 사용했습니다. 이와 같은 예보는 대부분 틀립니다. 요즈음은 ‘내일 비 올 확률은 30%입니다’와 같이 예보하는데, 이는 애매하게 들릴 수 있습니다. 그러면 여기서 30%란 숫자는 어떻게 얻어졌을까요? 수학자인 내 친구 하나는 이렇게 말합니다. “텔레비전 방송국에는 10명의 기상관이 있는 데 이들에게 내일 비가 올 것인지 아닌지를 물어서 이들 중 세 명이 비가 올 것으로 대답하면 ‘내일 비 올 확률이 30%입니다’라고 발표한다”는 것입니다.
물론 이 말은 틀린 이야기입니다. 이런 식으로 30%라는 숫자를 얻는 것이 아닙니다. 여기에는 보다 더 깊은 뜻이 있습니다. 과거의 자료를 토대로 하루 전 날의 기상조건이 오늘과 같았을 때 그 다음날 비가 온 경우의 빈도를 나타냅니다. 그 숫자는 우리에게 내일 비가 올 것인지에 관한 불확실성의 크기를 말 해주는데, 일기패턴에 관한 복잡한 모형과 대량의 관측자료를 토대로 하여 계산됩니다. 이런 의미에서 비가 올 확률로 표현하는 내일의 일기예보는 수학의 정리만큼이나 정교한 것으로서 한 개인이 다음날의 활동계획을 세우는데 필요한 모든 정보를 전달해 줍니다. 사람들은 각자 이 정보를 자기의 용도에 맞게 달리 이용할 것입니다. 불확실성에 관한 언급 없이 ‘내일 비가 올 것이다’라는 식의 단언적 일기예보는 실제적인 가치가 없습니다. 어떤 의미에서 그것은 비논리적입니다.
연역법과 귀납법 간에는 뚜렷한 차이가 있습니다. 연역적 추론에서는 하나의 명제를 증명하기 위하여 전제들의 부분집합A subset of premises을 선택할 수 있습니다. 귀납적 추론에서는 자료의 다른 부분집합을 사용하면Different subsets of data 결론이 달라지거나 때로는 모순된 결론에 도달할 수도 있으므로, 모든 자료를 필히 사용해야만 합니다. 필요한 경우 자료를 보완하거나 삭제하는 것은 추론의 절차에 의해 이뤄져야지 자료분석가의 취향에 따라 이뤄져서는 안됩니다.
통계학만 있으면 무엇이든 증명할 수 있다는 말을 하는데, 이는 자기가 마음에 품고 있는 어떠한 아이디어도 자료의 일부분을 선택하여 지지하게 할 수 있다는 것을 의미합니다. 이것이 바로 정치가들, 때로는 과학자들이 보편성이 없는 그들만의 생각을 강요하고자 할 때 하는 짓이며, 사업하는 사람들이 그들의 제품을 팔고자 할 때 조작하는 짓거리입니다.
귀납적 추론에서 주의해야 할 점이 또 한가지 있습니다. 그것은 주어진 자료만을 사용해야 한다는 것입니다. 즉, 입증되지 않은 가정이나 사적인 감정 또는 생각을 개입시켜서는 안됩니다. 여기 한 예가 있습니다. 자기가 살고 있는 궁전에는 시녀들만 일하고 있다고 믿은 한 왕자의 딱한 처지를 보여 주는 사건입니다.