[경고] 아래 글을 읽지 않고 "직교 다항식"을 보면 바보로 느껴질 수 있습니다.
[그림 1] 기하학에서 쓰이는 직교성(출처: wikipedia.org)
[그림 1]처럼 기하학에서 직각(right angle)의 의미로 쓰이는 직교성(orthogonality)은 함수상 내적(inner product on functions) $\langle f, g \rangle$로 추상화해서 사용 범위를 적분(integration)으로 확장할 수 있다. 함수의 직교성은 스튀름–리우빌 이론(Sturm–Liouville Theory)의 결과이면서 완비성(completeness)을 증명하는 중요 수단이다.
(1)
여기서 $r(x)$는 스튀름–리우빌 이론에 나오는 밀도 함수(density function) 혹은 가중치 함수(weighting function)이며 항상 0보다 크다.[∵ $f(x)$ = $g(x)$인 경우 식 (1)을 항상 0보다 크게 만드는 조건이다.] 직교 다항식(orthogonal polynomial)은 식 (1)의 함수 $f(x), g(x)$가 다항식이며 그 내적은 0이 되는 다항식이다.
(2)
주어진 적분 구간 $[a, b]$에서 직교 다항식을 생성하는 표준 방법은 그람–슈미트 과정(Gram–Schmidt process)이다. 다항식의 기저(basis)를 $1$, $x$, $\cdots$, $x^{n-1}$, $x^n$으로 두고, 주어진 다항식에 직교하는 또 다른 직교 함수를 차례로 생성한다. 먼저 그람–슈미트 과정에 따라 $\psi_0(x)$ = $a_0$으로 둔다. 다음으로 $\psi_1(x)$의 기저 $x$의 계수는 $a_1$로 설정하고 $\psi_0(x)$와 평행한 부분을 제거해서 $\langle \psi_1(x), \psi_0(x) \rangle$ = $0$으로 만든다.
(3a)
여기서 $a_n$은 $\psi_n(x)$에서 $x^n$의 실수 계수이다. 비슷한 방법으로 저차 다항식에 모두 직교하는 고차 다항식을 계속 만들 수 있다. 예를 들어, $\psi_0(x)$와 $\psi_1(x)$에 직교하도록 $\psi_2(x)$를 생성한다.
(3b)
(3c)
또한 $\psi_0(x), \psi_1(x), \cdots, \psi_n(x)$는 직교 기저(orthogonal basis)이기 때문에 $x^m$과도 항상 직교한다.
(4)
여기서 $\alpha_i$ = $\langle x^m, \psi_i(x) \rangle \mathbin{/} \langle \psi_i(x), \psi_i(x) \rangle$이다. 이와 같이 직교 다항식을 구성하는 계수 $a_0, a_1, \cdots, a_n$은 임의의 실수가 될 수 있으므로, 직교 다항식은 무수히 많이 존재한다.
직교 다항식 $\psi_n(x)$는 직교성인 식 (2)를 변형해서 스튀름–리우빌 미분 방정식(Sturm–Liouville differential equation)에 포함시킬 수 있다[1]. 그러면 스튀름–리우빌 이론(Sturm–Liouville theory)의 다양한 결과가 직교 다항식에도 바로 적용된다. 상상력만으로 직교 다항식의 미분 방정식을 만들기는 어렵기 때문에, 스튀름–리우빌 미분 방정식을 나침반으로 삼아 한 걸음씩 전진한다. 여분의 다항식 $p(x)$를 가진 새로운 항을 식 (2)에 추가해서 스튀름–리우빌 이론의 직교성을 강제로 만든다.
(5a)
여기서 함수 행렬식(Wronskian)은 $W[u, v]$ = $uv'-u'v$, $\lambda_n$은 직교 다항식 $\psi_n(x)$의 고유치(eigenvalue), 추가한 항이 $\psi_n(x)$에 관계없이 항상 0이 되도록 $p(a)$ = $p(b)$ = $0$이 되는 다항식을 선택한다. 식 (5a)에 나온 함수 행렬식을 풀어서 새로운 미분 방정식을 하나 찾는다.
(5b)
(5c)
여기서 $p(a)$ = $p(b)$ = $0$, 식 (7a)에 따라 구간 $(a, b)$에서 $p(x) > 0$이다. 최종적으로 식 (5c)는 직교 다항식에 대응하는 미분 방정식이며, 스튀름–리우빌 미분 방정식에 포함되기 때문에 직교 다항식은 다시 고유 함수(eigenfunction)가 되어서 스튀름–리우빌 이론의 모든 결과가 직교 다항식에도 성립한다. 식 (5c)를 더 일반화하기 위해 $r(x)$로 나눈다.
(6)
여기서 $p'(x)$ = $dp(x)/dx$; $p(x)$의 조건으로 인해 $Q(a)$ = $Q(b)$ = $0$이다. 식 (6)에서 모든 항의 다항식 차수가 같으려면, $Q(x)$는 2차 함수(quadratic function), $L(x)$는 선형 함수(linear function)가 되어야 한다. 그래서 $Q(x)$ = $q_0(x-a)(x-b)$, $L(x)$ = $cx+d$로 둘 수 있다. 만약 $Q(x)$가 완전한 2차 함수[$q_0 \ne 0$]인 때는 롤의 정리(Rolle's theorem)에 의해 $Q'(x_0)$ = $0$을 만족하는 $x_0$이 $(a, b)$ 사이에 존재한다. 이는 $L(x)$의 근이 $(a, b)$ 구간 안에 있다는 의미이다.
식 (6)으로부터 식 (5c)를 생성할 때는 적분 인자(integration factor)에 해당하는 $m(x)$가 필요하다.
(7a: 적분 인자)
(7b: 밀도 함수 혹은 가중치 함수)
여기서 $r(x) > 0$, $p(x) > 0$이므로 $Q(x) > 0$이 된다. 르장드르 다항식의 경우에 $Q(x)$ = $1-x^2$, $L(x)$ = $-2x$, $\lambda_n$ = $n(n+1)$인 식 (6)의 미분 방정식을 만족한다. 여기서 $Q(x)$의 근은 $\pm 1$이고 $L(x)$의 근은 $(-1, 1)$의 내부인 $x$ = $0$에 근이 있다. 식 (7a)를 가지고 르장드르 다항식의 $p(x)$도 구한다.
(8)
여기서 $p(x)$는 $(-1, 1)$에서 0보다 크도록 부호를 택한다. 식 (7a)와 같은 형태는 피어슨 미분 방정식(Pearson differential equation)으로 분류한다. 이 미분 방정식의 해인 $p(x)$를 이용해서 만든 연속 확률 분포(continuous probability distribution)는 피어슨 분포(Pearson distribution)가 된다. 피어슨 분포는 $Q(x), L(x)$의 계수를 바꾸어서 다양한 확률 분포를 생성할 수 있다. 다양성이 많은 만큼 피어슨 분포는 생물, 환경, 경제, 주식 등의 많은 분야에 쓰인다.
직교 다항식과 스튀름–리우빌 이론을 종합해서 직교 다항식이 내포한 다양한 성질을 증명한다.
- $\psi_n(x)$의 차수는 $n$
그람–슈미트 과정으로 얻은 식 (3c)에 따라 $\psi_n(x)$의 고차 항은 $x^n$이다.
- $\psi_n(x)$의 모든 근은 실수이며 단순근(simple root)
스튀름의 분리 정리(Sturm's separation theorem)로 인해 $\psi_n(x)$의 근은 모두 단순근이다. 또한 스튀름의 진동 정리(Sturm's oscillation theorem)를 적용하면, $\psi_{n+1}(x)$의 영점은 실수축에 있으며 $\psi_{n}(x)$보다 하나 더 많다.
- $\lambda_n$ = $\displaystyle{-n \left(\frac{n-1}{2}Q''(x) + L'(x) \right)}$
식 (6)에서 $x^n$의 계수를 모으면 $q_0 n(n-1) + c n + \lambda_n$ = $0$을 얻는다. 여기서 $Q''(x)$ = $2 q_0$, $L'(x)$ = $c$이다. 이로 인해 상수 함수인 $\psi_0(x)$의 고유치는 항상 $\lambda_0$ = $0$이다.
[참고문헌]
[1] J. Shohat, "A differential equation for orthogonal polynomials," Duke Math. J., vol. 5, no. 2, pp. 401–417, Jun. 1939.
[다음 읽을거리]