2024년 12월 23일 월요일

푸아송 분포(Poisson Distribution)

[경고] 아래 글을 읽지 않고 "푸아송 분포"를 보면 바보로 느껴질 수 있습니다.


[그림 1] 지진 발생 빈도와 분포(출처: wikipedia.org)

주어진 시간 동안 평균 회수 $\lambda$의 비율로 무작위 발생하는 사건이 만드는 이산 확률 분포(discrete probability distribution) 중에 유명한 푸아송 분포(Poisson distribution)가 있다[1], [2].

                          (1)

여기서 $k$는 설정된 시간 간격 동안 발생하는 사건 회수이며 그 평균은 $\lambda$, 각 사건은 서로 떨어져 발생하며 독립이다. 식 (1)의 확률 분포는 $X$ $\sim$ $\operatorname{Poi}(\lambda)$로 간단히 표시할 수 있다. 특별히 $k$ = $0$인 경우는 사건이 전혀 발생하지 않을 확률이다. 식 (1)을 참고하면 사건이 생기지 않는 확률은 $e^{-\lambda}$의 궤적을 따라간다.
푸아송 분포의 예를 들면, [그림 1]에 소개한 지진 발생 빈도는 푸아송 분포를 따른다. 현재까지 지식으로는 지진이 발생하는 원리를 알 수 없어서, 지진은 임의로 생긴다고 가정한다. 하지만 역사적으로 아주 오랜 기간 동안 특정 지역에서 발생하는 지진을 계속 관찰하고 있기 때문에 1년 동안 발생하는 지진의 평균 회수인 $\lambda$를 알고 있다. 그러면 1년 동안 지진이 $k$번 발생할 확률은 푸아송 분포인 식 (1)로 추정 가능하다.
푸아송 분포를 상상하는 가장 좋은 방법은 이항 분포(binomial distribution)에서 희귀 사건(rare event)이 출현하는 빈도이다. 이 개념은 푸아송 극한 정리(Poisson limit theorem)로 알려져있다. 푸아송 분포의 보기로서 베르누이 과정(Bernoulli process)인 여러 번의 동전 던지기를 생각한다. 확률 실험을 위해 동전을 같은 간격으로 계속 던지며 결과를 10번 모으기 해서, 앞면이 한 번만 나오는 희귀 사건 $R$을 찾는다. 이항 분포로 계산한 이 희귀 사건의 확률은 $P(R)$ = $p$ = ${}_{10}C_1 \cdot (1/2)^{10}$ = $5/512$ $\approx$ $0.0098$이다. 쉽게 말해 10번 모으기를 $n$ = 100회 정도하면 $R$은 평균 $\lambda$ $\approx$ $np$ $\approx$ $0.98$ 혹은 한 번 정도 나온다. 이 분포는 점근적으로 푸아송 분포를 따라가기 때문에 희귀 사건 $R$이 한 번 발생하는 확률인 $\operatorname{Pr}[X = 1]$은 $e^{-0.98} \cdot 0.98$ $\approx$ $36.8$%이다. 이항 분포로 재계산한 확률은 ${}_{n}C_1 p (1-p)^{n-1}$ $\approx$ $37.0$%로 계산되어 푸아송 분포와 이항 분포의 결과는 서로 비슷하다. 이런 희귀 사건에서 이항 분포가 푸아송 분포로 수렴되는 현상이 바로 푸아송 극한 정리이다.

[그림 2] 민중을 이끄는 자유의 여신(출처: wikipedia.org)

1837년푸아송 56세, 조선 헌종 시절에 푸아송 분포를 제안한 푸아송Siméon Denis Poisson(1781–1840)은 사법 제도인 배심제(陪審制, jury system)의 한계를 설명하고 개선하기 위해 이 분포를 제안했다[1]. 푸아송 이전에 니콜라우스 베르누이 1세Nicolaus I Bernoulli(1687–1759)가 법학에 확률론을 도입한 논문으로 22세인 1709년베르누이 22세, 조선 숙종 시절에 박사 학위를 받았다[3]. 니콜라우스의 학위 지도교수는 자기 삼촌인 야곱 베르누이Jacob Bernoulli(1655–1705)였다. 니콜라우스는 형사 소송의 대원칙인 증거 재판주의(證據裁判主義, principle of evidence)의 근거를 확률론으로 증명했다. 기소된 피고인이 혹시 무죄일 수 있기 때문에, 증거 재판주의에 따라 합리적인 의심이 없을 정도로 많은 증거를 모아서 피고인의 유죄 여부를 판단해야 한다. 이 증거 재판주의의 타당성을 밝히기 위한 니콜라우스의 방법론은 간단했다. 하나의 증거가 있을 때, 피고인에 유리하도록 이 증거가 틀리는 비율을 2:1로 가정했다. 즉, 피고인이 유죄라는 명확한 증거지만, 3번중 2번은 증거가 틀릴 수 있다고 극단적으로 생각한다. 그러면 증거가 틀리는 사건을 $E$라고 할 때, $P(E)$ = $2/3$가 된다. 이에 따라 독립적인 증거가 $n$개 있는 경우, 피고인이 잘못된 유죄 판결을 받을 확률은 $(2/3)^n$이다. 그래서 $n$이 매우 커진다면  $(2/3)^n$은 0에 수렴하므로, 피고인이 결백할 확률은 없어진다.
평생 이공과대학(École Polytechnique) 교수였던 수학자 푸아송은 갑자기 왜 배심제와 평결(評決, verdict)이 내포한 근원적 문제점을 고민하고, 자기 연구 결과를 대중에게 적극적으로 알리려 노력했을까? 정치와 혁명에 적극 참여한 푸리에Joseph Fourier(1768–1830)와 거의 같은 이력을 가진 푸아송은 푸리에와 다른 길을 걸었다.[푸리에와 푸아송의 지도교수는 라그랑주; 둘 다 이공과대학 교수] 푸아송은 1830년 이전까지 정치를 멀리하고 수학과 자연 과학에만 집중했다. 이 무렵 푸아송의 연구 관점을 이해하려면 1830년까지도 계속 이어진 혼란한 프랑스의 역사와 주변 환경을 알아야 한다. 1789년조선 정조 시절 부르봉 왕조(House of Bourbon)를 무너뜨린 프랑스 대혁명(French Revolution), 단두대 정치의 정점을 보여준 공포스러운 프랑스 제1공화국(French First Republic), 영웅 나폴레옹의 등장과 쇠락, [그림 2]에 나온 1830년조선 순조 시절 7월 혁명(July Revolution)으로 부르봉 왕조의 방계 가문인 오를레앙 왕조(House of Orléans)로의 복귀를 연이어 겪으면서, 현실적 사회 문제에 관심을 가진 푸아송은 시민이 참여하는 배심제가 지닌 장점과 한계를 자신의 주특기인 확률과 통계로 분석했다.
프랑스는 대륙법에 근간을 두고 있어 영미법의 배심제가 없던 국가였지만, 1789년 프랑스 대혁명을 거치며 1790년부터 배심제를 도입하고 1791년에 배심제의 사법적 기초를 확립했다. 이때 중세 프랑스(French middle ages)부터 존재하던 검사(prosecutor) 및 변호사(lawyer) 역할을 개조해서, 세계 최초로 변호사와 구별되는 검사 제도를 1791년에 발명했다. 이 검사제는 시민의 인권을 존중하면서 범죄자를 처벌하는 중요한 수단이다. 배심제로 인해 프랑스 사법 체계의 구성원으로 시민이 등장하였고, 사법 제도의 중요한 의무중 하나로 평범한 시민들이 이해할 수 있는 법률 해석과 적용이 등장했다. 배심원 평결은 대부분 옳은 판단을 하지만 아주 드물게 사법적으로 잘못된 판결을 내릴 수 있다. 푸아송 극한 정리에 나오는 희귀 사건의 유례가 바로 배심원이 내리는 잘못된 판정이다. 군주와 의회가 위태로운 정치적 동거를 하는 1830년대 프랑스에서 사법제의 순수성에 도전하는 듯한 푸아송의 결과가 용인될 수 있는 분위기는 허약해진 프랑스에 남아있는 위대한 정신을 보여준다. 다만 푸아송은 7월 혁명의 결과로 인해 모든 학술적 영예를 잃을 뻔했지만, 동료 과학자인 아라고François Arago(1786–1853)가 루이-필리프 1세Louis-Philippe I(1773–1850) 왕 앞에서 기지를 발휘해 구해주었다. 이후 연구 업적이 계속 쌓여서 푸아송 분포를 발표한 1837년에는 프랑스 귀족 작위를 받았다.
푸아송 분포는 사회 과학에 확률론을 접목하기 때문에 비판도 많이 받았다. 기계론이 지배하는 자연 과학에 쓰는 확률론을 인간의 자유 의지가 난무하는 사회 과학에 사용할 수 있는가? 푸아송은 여러 자료를 수집하고 통계를 내서, 큰 수의 법칙(law of large numbers)이 지배하는 조건에서는 배심원 판결의 오류를 추정하는 작업에 푸아송 분포를 쓸 수 있다고 당당히 주장했다. 지금은 확률 및 통계가 사회 과학의 기본적인 연구 방법론이 되었다.
푸아송 분포의 평균(mean or average)이 정말 $\lambda$인지 식 (1)로 계산한다.

                          (2)

식 (1)에 나온 푸아송 분포의 가정처럼 평균은 $\lambda$로 유도된다. 비슷한 방식으로 푸아송 분포의 분산(variance)도 확인한다.

                          (3)

신기하게도 푸아송 분포의 평균과 분산은 $\lambda$로 동일하다. 모든 차수의 적률(moment) $E[X^n]$을 담고 있는 적률 생성 함수(moment-generating function, MGF) $M_X(s)$를 계산한다.

                          (4)

푸아송 분포를 이루며 서로 독립인 확률 변수의 합 $X$ = $X_1 + X_2 + \cdots + X_n$의 확률 분포는 MGF로 유도한다.

                          (5)

여기서 $\lambda_i$는 $X_i$의 평균 발생 회수이다. 따라서 확률 변수의 합 $X$는 다시 푸아송 분포가 되며 $X$ $\sim$ $\operatorname{Poi}(\lambda_1 + \lambda_2 + \cdots + \lambda_n)$을 추종한다.

[참고문헌]
[3] I. Todhunter, A History of the Mathematical Theory of Probability: From the Time of Pascal to That of Laplace, Cambridge and London: Macmillan and Co., 1865.

[다음 읽을거리]

댓글 없음 :

댓글 쓰기

욕설이나 스팸글은 삭제될 수 있습니다. [전파거북이]는 선플운동의 아름다운 인터넷을 지지합니다.