2024년 12월 31일 화요일

베타 분포(Beta Distribution)

[경고] 아래 글을 읽지 않고 "베타 분포"를 보면 바보로 느껴질 수 있습니다.


[그림 1] 형상 모수 $\alpha, \beta$에 따른 베타 분포 $\beta(\alpha, \beta)$의 변화(출처: wikipedia.org)

베타 분포(beta distribution)베타 함수(beta function)와 동일한 확률 밀도 함수(probability density function, PDF)를 가진 연속 확률 분포(continuous probability distribution)이다.

                          (1)

여기서 $0 < x < 1$, $\alpha > 0$, $\beta > 0$; $B(\alpha, \beta)$는 형상 모수(shape parameter) $\alpha, \beta$에 의해 값이 바뀌는 베타 함수이다. 베타 함수는 $X$ $\sim$ $\beta(\alpha, \beta)$처럼 표기한다. 분모에 출현한 $B(\alpha, \beta)$는 PDF $f_X(x)$의 적분을 1로 만드는 정규화 상수이다. 베타 분포는 $\alpha, \beta$를 바꾸어서 다양한 확률 분포를 생성할 수 있는 카멜레온 성질이 있다. 만약 $\alpha$ = $\beta$ = $1$로 두면, 베타 분포는 $x$에 대해 확률값이 일정한 균등 분포(uniform distribution)가 된다. 관점을 바꾸어 $x$를 고정하고, $\alpha, \beta$를 정수인 $k$ = $\alpha-1$, $n-k$ = $\beta-1$, $n$ = $\alpha + \beta - 2$로 두면, 식 (1)은 이항 분포 ${\rm Bin}(n, x)$의 확률에 정비례한다.

                          (2)

베타 분포의 누적 분포 함수(cumulative distribution function, CDF)는 불완전 베타 함수(incomplete beta function) $B(x; \alpha, \beta)$로 표현된다.

                          (3)

여기서 $B(1; \alpha, \beta)$ = $B(\alpha, \beta)$이다. 베타 함수의 성질을 이용해서 베타 분포의 평균(mean or average)과 분산(variance)도 구한다.

                          (4a)

                          (4b)

평균은 $\alpha$와 $\beta$의 나눗셈으로 나오기 때문에, 형상 모수 $\alpha, \beta$를 평균 $\mu$ 기준으로 다시 쓸 수 있다.

                          (5)

여기서 형상 모수 $\nu$는 0보다 큰 실수이다.

[다음 읽을거리]

댓글 없음 :

댓글 쓰기

욕설이나 스팸글은 삭제될 수 있습니다. [전파거북이]는 선플운동의 아름다운 인터넷을 지지합니다.