2011년 12월 8일 목요일

베셀의 미분 방정식(Bessel's Differential Equation)

[경고] 아래 글을 읽지 않고 "베셀 미분 방정식"을 보면 바보로 느껴질 수 있습니다.
1. 스튀름–리우빌 이론
2. 프로베니우스 방법의 적용
3. 천장에 매달린 사슬의 운동 방정식


베셀Friedrich Wilhelm Bessel(1784–1846)이 일반화 시킨 다음 미분 방정식을 베셀의 미분 방정식(Bessel's differential equation)이라 한다.

                       (1)

                      (2a)

                      (2b)

여기서 $y(\xi x)$는 $y(x)$의 변수 치환이다.
재미있는 수학사적 사실은 베셀의 박사 학위 지도교수(advisor)가 가우스Carl Friedrich Gauss(1777–1855)란 부분이다[4]–[7]. 베셀은 가우스의 추천으로 1810년베셀 26세, 조선 순조 시절에 괴팅겐[정확한 발음은 괴팅엔이나 우리 전통에 따라 괴팅겐으로 표기] 대학교(Georg-August-Universität Göttingen)의 명예 박사 학위(honorary doctorate)를 취득하게 된다[6]. 우리를 힘들게 하는 베셀 함수(Bessel function)를 만든 베셀이지만, 박사 학위가 없어 한때 서러움을 당했다. 천문학과 수학을 거의 독학으로 공부해 성과를 만들어낸 천재여서, 베셀은 1809년베셀 25세, 조선 순조 시절에 쾨니히스베르크 천문대(Königsberg Observatory) 책임자와 교수직을 제안 받았다. 하지만 박사 학위가 없어서 임용이 결국 거절되었다. 베셀은 박사 학위를 받기에 충분한 능력을 갖추었지만, 자존심에 큰 상처를 입어서 인근 대학의 쉬운 박사 학위에 지원하지는 않았다. 능력이 아닌 학위만 보는 불합리한 권위에 굴복하는 모습을 보여주고 싶지 않았기 때문일 것이다. 이러한 심적 난처함을 도와준 구세주가 가우스였다. 깐깐한 가우스지만 열정적인 천재에게는 한없이 관대했다. 가우스의 적극적인 추천과 이전의 본인 업적으로 박사 학위를 받은 베셀은 결국 쾨니히스베르크 천문대장이 된다. 이후 평생을 쾨니히스베르크에 머물며 하늘을 정밀하게 관찰하게 된다. 쾨니히스베르크 하늘을 보고 고민하며 이룬 업적 중 하나가 그 유명한 베셀 함수이다. 가우스의 지원이 없었다면 이 베셀 함수는 다른 이름을 가졌을 수도 있다.
베셀 함수는 천장에 매단 사슬(hanging chain)의 움직임[3]을 연구하던 다니엘 베르누이Daniel Bernoulli(1700–1782)가 1732년베르누이 32세, 조선 영조 시절에 처음으로 제안하고[베르누이가 제안한 함수는 식 (11)에 있는 제0차 제1종 베셀 함수] 베셀이 1824년베셀 40세, 조선 순조 시절에 일반화시켰다. 예전부터 유명했던 베셀 함수는 식 (1)이나 (2)의 해로 정의한다[2]. 당연한 말이지만 베셀 함수의 대부분 성질은 식 (1)이나 (2)를 통해 증명할 수 있다. 식 (1)의 베셀 미분 방정식은 다음과 같은 프로베니우스 방법을 위한 미분 방정식 관점으로 풀 수 있다.

                      (3)

여기서 $p(x), q(x)$는 발산하지 않는다. 식 (1)과 (3)을 비교하면 $p(x)$ = $1$, $q(x)$ = $x^2 - n^2$이 되어 $p(x), q(x)$가 발산하지 않으므로 프로베니우스 방법을 쓸 수 있다. 식 (4)에 있는 지표 방정식(indicial equation)을 이용하면 지표값 $r$은 다음처럼 결정된다.

                      (4)

                      (5)

[그림 1] 제1종 베셀 함수(출처: wikipedia.org)

만약 $r_1$ = $n$이라 정하면, 베셀 미분 방정식의 첫번째 해는 다음처럼 구할 수 있다.

                      (6)

         (7)

식 (7)에 $r_1$ = $n$을 대입하면, 다음 재귀 관계(recursion relation)를 얻을 수 있다.

     (8)

그러면 식 (8)의 마지막 식을 식 (6)에 대입해 첫번째 해를 구할 수 있다.

            (9)

여기서 !는 계승(階乘, factorial)을 의미한다. 식 (9)와 같은 첫번째 해는 식 (10)처럼 표기하고 제1종 베셀 함수(Bessel function of the first kind)라 부른다. 다음 조건처럼 $a_0$를 정하자.[∵ $a_0$는 임의이므로 아무값이나 넣을 수 있는데 식 (9)를 간단하게 표기할 수 있는 방식으로 $a_0$를 정하자.]

                      (10)

식 (10)의 정의를 식 (9)에 대입하면 제1종 베셀 함수를 완전히 얻을 수 있다.

                       (11)

식 (10)의 정의로 인해 제1종 베셀 함수는 간편하게 표기할 수 있다. 미분 방정식 (1)에서 $n$이 정수가 아닌 실수라면 보통 $\nu$로 표기한다. 계승의 일반화인 감마 함수(gamma function)를 이용하면 식 (11)을 일반화할 수 있다.

                      (12)

                      (13)

식 (13)을 식 (11)에 대입하면 일반화된 제1종 베셀 함수를 정의할 수 있다.

                       (14)

프로베니우스 방법에서 $r_2$ = $-n$을 대입하면 두번째 해를 얻을 수도 있다. 하지만, 다음 베셀 함수 관계로 인해 첫번째 해와 종속되어버린다. 아래 식은 식 (14)와 감마 함수의 성질을 이용해 증명한다.

                      (15)

하지만, $n$이 정수가 아니면 $J_\nu (x)$와 $J_{-\nu}(x)$는 서로 독립적인 관계가 된다.[∵ 식 (14)의 분모에 있는 감마 함수가 무한대가 되는 경우가 생기지 않는다.] 즉, $J_{-\nu}(x)$가 두번째 해가 된다.

[그림 2] 제2종 베셀 함수(출처: wikipedia.org)

식 (15)를 바탕으로 제2종 베셀 함수(Bessel function of the second kind)를 정의한다[1], [2].

                       (16)

여기서 $N_\nu (x)$는 $Y_\nu (x)$로 표기하기도 한다. 제2종 베셀 함수는 수학자 노이만Carl Neumann(1832–1925) 혹은 베버Heinrich Martin Weber(1842–1913)의 이름을 이용해서 노이만 함수(Neumann function) 혹은 베버 함수(Weber function)라고도 부른다. 베셀 함수 $J_\nu (x)$와 $J_{-\nu}(x)$는 서로 독립이기 때문에, $\nu$ $\ne$ $n$인 경우 식 (16)은 타당한 두번째 해가 된다. 물론 프로베니우스 방법을 이용해 두번째 해를 다음처럼 구할 수도 있다.

                      (17)

하지만, 상미분 방정식 해의 존재성과 유일성이 있는데 굳이 식 (17)처럼 어려운 길을 갈 필요는 없다. 2계 상미분 방정식의 독립적인 해는 두가지이므로, 서로 다른 해인 식 (14)와 (16)의 선형 결합으로 식 (17)을 표현하여 대체할 수 있다. 식 (16)처럼 제2종 베셀 함수를 지저분하게 정의하는 이유는 $\nu$ = $n$인 경우에도 써먹기 위해서다. 식 (16)에 극한(limit)을 취하면 정수 차수(integer order) 제2종 베셀 함수를 정의할 수 있다[1].

                      (18)

그러면 식 (15)에 의해 식 (18)의 분자와 분모가 0이 되어서 함수값이 존재하게 된다. 로피탈의 정리(L'Hôpital's rule)를 써서 식 (18)을 계산하자.

                      (19)

식 (19)를 계산하기 위해 식 (14)에 있는 베셀 함수를 차수에 대해 미분해보자.

      (20)
여기서 $\psi(\cdot)$는 다이감마 함수(digamma function)이다. 식 (20)의 결과를 식 (19)에 대입하자.


                                                                                                    (21)

기가 막힌 방법으로 식 (21)을 얻었지만 식 (21)에는 다소 문제가 있다. $m \le n-1$인 경우 $(m-n)!$과 $\psi (m-n+1)$이 발산하기 때문에 대책이 필요하다.[∵ 함수 $\psi (m-n+1)$이 발산하는 특성은 식 (23)과 (24)를 봐도 자명하다. 계승 $(m-n)!$의 크기가 발산하지만 식 (24)의 둘째식은 유한하므로, $\psi (m-n+1)$의 크기도 무한히 커져야 한다.] 이 문제를 해결하려면 식 (22)에 있는 오일러의 반사 공식(Euler's reflection formula)을 이용해야 한다[1].

                      (22)

또한 식 (21)에서 발산하여 문제가 되는 부분은 다음처럼 바꾼다.

                      (23)

식 (23)의 우변에 식 (22)를 대입하여 미분하면 다음을 얻을 수 있다.

                      (24)

식 (24)를 이용하면 식 (21)에 나오는 무한 급수(infinite series)를 단순화시킬 수 있다.

            (25)

그러면 정수 차수를 가진 제2종 베셀 함수를 아래처럼 표현할 수 있다.

                  (26)

참 먼 길을 달려왔다. 식 (26)의 정수 차수 제2종 베셀 함수를 유도하는 과정은 결코 쉬운 일이 아니다. 오죽 힘들면 약 120년전에 나온 수학 논문지[1]에 위 과정이 실렸겠는가! 그래서 대부분의 공학 수학책에는 이 증명을 소개하지 않는다. 위 유도 과정없이 식 (26)을 보면 정말 마법이다. 우리가 근접할 수 없는 무언가가 있는 것 같다. 하지만 식 (18)부터 (26)까지 따라가 보면 그냥 수학적 과정을 이어나가서 결과를 얻고 있다.
식 (1)의 해를 베셀 함수의 정의인 식 (14) 혹은 (16)과는 조금 다르게 선택할 수도 있다. 예를 들어, 복소수(complex number)를 이용해 식 (14)와 (16)의 결과를 연결하면 다음과 같은 한켈 함수(Hankel function)가 된다.

                       (27)

한켈 함수는 제3종 베셀 함수(Bessel function of the third kind)라고도 한다. 한켈 함수는 베셀 함수를 많이 연구했던 요절한 수학자 한켈Hermann Hankel(1839–1873)의 이름을 따서 붙였다. 맥스웰 방정식(Maxwell's equations)의 핵심인 스토크스의 정리(Stokes' theorem)도 한켈이 1861년한켈 22세, 조선 철종 시절에 증명했다.
식 (28)에 제시한 스튀름–리우빌 미분 방정식(Sturm–Liouville differential equation)을 이용하고 $x \rightarrow \sqrt{\lambda} x$로 치환해서 식 (1)을  스튀름–리우빌 형태(Sturm–Liouville form)로 표현할 수 있다.

                       (28)

                       (29)

식 (28)과 (29)를 비교하면 $p(x)$ = $x$, $q(x)$ = $n^2 / x$, $r(x)$ = $x$가 된다. 식 (29)에 존재하는 $\lambda$의 의미는 무엇일까? 수학적으로 $\lambda$는 이산적으로 무한히 존재하는 고유치이며, 물리적으로는 원통 형태 공간에 파동이 갇혀있는 특성을 의미한다. 예를 들어 금속으로 된 원통에 존재하는 전자파의 위상 상수(phase constant, $\beta$)가 $\lambda$와 관계있다.

                       (30)

식 (29)에서 치환 $x \rightarrow \sqrt{\lambda} x$를 이용하지 않고 식 (30)처럼 $\lambda$ = $-n^2$라 가정하면, $r(x)$ = $1/x$도 가능하지 않을까? 이렇게는 안된다. 스튀름–리우빌 이론에서 $q(x)$는 특별한 제약이 없지만, $r(x)$는 직교성 적분이 정의되도록 선택되어야 한다. 만약 $r(x)$ = $1/x$이라면 $x$ = $0$에서 특이점이 생기므로, 어떤 경우에는 직교성 적분이 정의되지 않는다.[예를 들어 $n$ = $0$인 경우 $J_0 (0)$ = $1$이 된다. $r(x)$ = $1/x$이라면 $n$ = $0$에 대한 직교성 적분이 발산한다.] 그래서 $r(x)$ = $x$가 되어야 한다. 다만 $x$ = $0$을 회피한 적분 구간이라면 $r(x)$ = $1/x$로 선택할 수도 있기 때문에[예를 들어 콘토로비치–레베데프 변환(Kontorovich–Lebedev transform)], 눈을 크게 뜨고 우리가 무엇을 하고 있는지 분위기를 잘 파악해야 한다.

제1종 베셀 함수의 인자는 복소수(complex number)가 될 수도 있다. 복소수 입력 변수의 크기가 $x$이고 편각이 $135^\circ$라면, 다음처럼 제1종 켈빈 함수(Kelvin function of the first kind) $\operatorname{ber}_\nu(\cdot)$와 $\operatorname{bei}_\nu(\cdot)$로 표현할 수 있다.

                        (31)

여기서 $x$는 실수이며 $\operatorname{ber}_\nu(\cdot)$와 $\operatorname{bei}_\nu(\cdot)$는 각각 식 (31)의 실수부와 허수부이다. 켈빈 함수의 제안자는 온도의 단위로 쓰는 켈빈William Thomson, Lord Kelvin(1824–1907)이다. 차수 $\nu$ = $0$인 경우는 다음처럼 켈빈 함수를 더 간단히 쓸 수 있다.

                       (32)

식 (32)의 우변을 $x$에 대해 미분하면 다음을 얻는다.

    (33)

여기서 $(\cdot)'$는 $x$에 대한 미분이다. 제1종 켈빈 함수는 원통형 도선의 전류 밀도(electric current density)를 공식화할 때 유용하게 쓰인다.

[참고문헌]
[1] M. Bocher, "On Bessel's functions of the second kind," Ann. Math., vol. 6, no. 4, pp. 85-90, Jan. 1892.
[2] G. N. Watson, A Treatise on the Theory of Bessel Functions, Cambridge University Press, 1922.
[3] C. Byrne, Notes on Bessel's Equation and the Gamma Function, University of Massachusetts Lowell, April 2009.
[4] Carl Friedrich Gauss, Wikipedia.org.
[5] Friedrich Wilhelm Bessel, The MacTutor History of Mathematics, University of St Andrews, Scotland, 1997.
[6] Friedrich Wilhelm Bessel, Mathematics Genealogy Project.
[7] J. L. Heilbron, The Oxford Guide to the History of Physics and Astronomy, Volume 10, Oxford University Press, 2005.

[다음 읽을거리]
1. 베셀 함수
2. 베셀 함수의 점근식
3. 구면 베셀의 미분 방정식
4. 원통 좌표계의 전자장 표현식

2011년 12월 7일 수요일

프로베니우스 방법의 적용(Application of Frobenius Method)

[경고] 아래 글을 읽지 않고 "프로베니우스 방법 적용"을 보면 바보로 느껴질 수 있습니다.
1. 미분 방정식의 의미
2. 선형 상미분 방정식
3. 멱급수 기반 상미분 방정식 해법
4. 1계 선형 상미분 방정식의 해법


프로베니우스 방법(Frobenius method)은 정상적인 멱급수(power series) 방법이 통하지 않을 때 사용하는 획기적인 기법이다.

                      (1)

여기서 $p(x), q(x)$는 발산하지 않는다. 식 (1)의 해를 구하려면 다음처럼 해를 가정하면 된다.

                      (2)

여기서 지수에 대한 상수 $r$은 다음에 나오는 지표 방정식(indicial equation)을 만족해야 한다.

                      (3)

식 (3)은 2차 방정식이므로 상수 $r$은 두 가지 해 $r_1$과 $r_2$를 가진다. $r_1$, $r_2$에 따라 프로베니우스 방법을 적용하는 법이 달라진다. 또한, 식 (1)은 2계(階) 선형 상미분 방정식(the second order linear ordinary differential equation, 2nd linear ODE)이므로 서로 다른 두 가지 해를 반드시 가져야 한다. 먼저 첫번째 해는 식 (2)를 이용해 쉽게 결정할 수 있다.

                       (4)

여기서 계수 $a_m$은 식 (4)를 식 (1)에 대입해 항등식 조건[$x^{r+m}$의 계수가 0]을 이용해서 구한다. 두번째 해 $y_2$는 $r_2$의 특성에 따라 달라진다.


   1. $r_1 \ne r_2$인 경우   

지수 상수 $r_2$가 $r_1$과 다르다면 두번째 해 $y_2$는 다음처럼 쉽게 표현된다.

                       (1.1)

하지만, $r_1, r_2$가 서로 다르더라도 $r_1 - r_2$가 정수가 되면 식 (4) 및 (1.1)과 같은 경우가 생긴다. 이때는 식 (3.3)을 적용해야 한다.


   2. $r_1$ = $r_2$인 경우   

선형 상미분 방정식 경우와 동일하게 두번째 해 $y_2$를 다음처럼 정해서 식 (1)에 대입한다.

                      (2.1)

치환을 통해 식 (1)의 미분 방정식을 식 (2.1)로 단순화시킬 수 있다. 다음으로 프로베니우스 방법 증명 때와 동일하게 $x$ = $0$ 근방에서 $y_2$가 만족해야 하는 특성을 생각한다. 먼저 $y_1$은 코쉬-오일러 방정식(Cauchy-Euler equation)에 의해 다음을 만족해야 한다.

                      (2.2)

여기서 $c_0$는 임의의 상수이다. 식 (2.2)의 특성을 식 (2.1)에 대입하면 $u'$에 대한 미분 방정식을 얻을 수 있다.

                      (2.3)

여기서 $y_1$ = $x^{r_1}$, $a$ = $p(0)$, $c_0$는 적분에서 얻어진 상수이다. 식 (2.3)의 셋째식은 식 (3)의 지표 방정식이 중근을 갖기 위한 조건[$[r + (a-1)/2]^2$ = $0$]이다.[이상의 조건을 식 (2.3)의 둘째식에 대입하면 $x u'' + u'$ = $0$이란 미분 방정식을 얻을 수 있다. 이를 풀면 $u$ = $c_0 \log x$란 해를 얻는다.] 그러면 $x$ = $0$ 근방에서 $y_2$는 다음 관계를 만족해야 한다.

                      (2.4)

식 (2.4)를 그대로 식 (2.1)의 세째줄에 대입하기에는 너무 복잡하므로 좀더 단순화한다. 식 (2.4)에서 로그 함수(logarithmic function)가 나온 이유는 $x$ = $0$ 근방에서 함수가 변하는 모양을 규정하기 위함이다. 식 (2.5)를 이용하면 식 (2.4)를 좀더 단순하게 표현할 수 있다.

                      (2.5)

즉, 식 (2.5)가 성립하기 때문에 식 (2.4)에서 $m \ge 1$ 인 경우는 $x$ = $0$에서 테일러 급수(Taylor series)를 전개할 수 있다.

                      (2.6)

또한 식 (2.5)로 인해 최종 결과는 식 (2.6)으로 표현할 수 있다. 왜냐하면 $x$ = $0$ 근방에서는 식 (2.5)에 의해 $y_1(x) \cdot {\rm log}x$처럼 움직이며 $x$ = $0$에서 멀어지면 로그 함수의 특이점이 없어지기 때문에 테일러 급수 전개가 가능해야 한다. 이 두가지 개념을 하나로 합치면 식 (2.5)가 된다. 추가적으로 $x$ = $0$ 근방의 특성을 규정하기 위해 첨자 $m$은 0이 아닌 1부터 시작한다. 첨자 $m$은 1부터 시작하기 때문에 $x$ = $0$ 근방의 특성은 $y_1 (x) \log x$가 나타낸다. 식 (2.6)에 식 (4)를 대입하여 테일러 급수 전개하면 두번째 해 $y_2$를 더 간단하게 표현할 수 있다.

                       (2.7)

여기서 계수 $d_m$을 구하기 위해서는 식 (2.7)을 식 (2.1)에 대입해서 항등식 조건을 이용한다. 재미있는 부분은 식 (2.7)을 사용하더라도 $x$ = $0$ 근방에서 행동하는 방식은 식 (2.4)와 동일함이다.[식 (2.6)과 동일한 이유로 첨자 $m$은 1부터 시작한다.]


   3. $r_1 - r_2$ = $M$인 경우   

$r_1 - r_2$가 정수만큼 차이나는 경우에 식 (4) 및 (1.1)은 같을 수 있다.[항상 이렇지는 않다. 꼭 기억한다.] 편하게 생각하기 위해 $r_1 > r_2$라 가정해서 정수 $M$은 항상 0보다 큰 자연수라고 가정한다.

[표 1] $r_1 - r_2$ = $1$인 경우의 멱급수 예시

예를 들어, [표1]처럼 $r_1 - r_2$ = $1$일 때 $a_0$ = $1$, $a_1$ = $2$, $a_2$ = $3$, $\cdots,$ $b_0$ = $1$, $b_1$ = $0$, $b_2$ = $2$, $b_3$ = $3$, $\cdots$ 이런 식으로 계수가 얻어진다고 가정한다. 만약 $m$ = $0$인 경우는 $a_0$ 혹은 $b_0$ 앞에 식 (3)의 지표 방정식이 항상 곱해지고 지표 방정식은 0이 되어야 하므로 $x^r$의 계수값은 항상 0이다.[∵ 이렇게 지표 방정식이 0이 되어야 $a_0, b_0$을 임의로 택할 수 있다. 식 (3.6)도 함께 참고한다.] 그러면, $r_1, r_2$는 다르지만 [표 1]에 의해 식 (4)와 (1.1)이 같아진다. 즉, 해가 서로 독립이 되지 않는다. 그래서 이 경우는 새로운 방법을 찾아야 한다. 접근 방법은 $r_1$ = $r_2$인 경우와 매우 유사하다. 점 $x$ = $0$ 근방에서 식 (2.3)을 이용하면 다음과 같은 $u$를 얻을 수 있다.

                      (3.1)

여기서 $a$ = $p(0)$이다. 물론 이 결과는 당연하다.[∵ $x$ = $0$ 근방에서 $y_2$는 $x^{r_2}$처럼 움직여야 한다.] 식 (2.4)와 동일한 과정을 이용하면 $y_2$는 다음과 같다.

                      (3.2)

그런데 식 (3.2)는 모양만 다르다 뿐이지 식 (1.1)과 동일하다. 하지만, 위에서 예로 든 $y_1$ = $y_2$인 경우는 $r_1$ = $r_2$인 경우와 동일하므로, 최종해는 식 (2.7)과 동일한 모양을 가져야 한다.

                       (3.3)

여기서 $\eta$는 결정되어야 하는 상수이다. 식 (2.7)과 다르게 상수 $\eta$가 식 (3.3)에 쓰인 이유는 무엇일까? $r_2$를 미분 방정식에 대입한 결과가 $y_1 \ne y_2$라면 $\eta$ = $0$이 되어야 한다. 만약 $y_1$ = $y_2$가 되면, 식 (3.3)에서 로그 항이 살아남아야 하므로 $\eta \ne 0$이 되어야 한다. 이를 위해 상수 $\eta$가 꼭 필요하다.
식 (3.3) 증명에 엄밀성을 더하려면 식 (2.1)을 다시 고려해야 한다. 식 (2.1)을 $u'$ 관점으로 생각하면 $u'$에 대한 1계 선형 상미분 방정식(the first linear ODE)이 보인다. 1계 선형 상미분 방정식은 해법이 있으므로 $u'$은 반드시 다음 식이 되어야 한다.

                      (3.4)

식 (4)를 식 (3.4)에 대입하면 다음을 얻는다.

                      (3.5)

식 (3.5)를 통해 식 (3.3)처럼 로그 함수가 출현하는 경우는 $m$ = $M$인 경우이다. 물론 $c_M \ne 0$인 경우에만 로그 함수가 출현한다. 쉽게 생각하면 식 (2.1)에서 $y_1(x)$와 $p(x)$를 급수 전개하면 $u'(x)$가 $1/x$ 항을 가질 수 있기 때문에 로그 함수가 출현할 수 있다.
이상의 결과를 바탕으로 식 (4) 및 (1.1)에 있는 $a_m, b_m$의 재귀 관계를 구한다. $b_m$ 구하기는 $a_m$ 구하기와 유사하므로 $a_m$만 구해본다.

            (3.6)

재귀 관계를 공식화하는 식 (3.6)을 가지고 $a_0$부터 $a_m$을 순차적으로 얻는다.
  

[다음 읽을거리]
1. 베셀의 미분 방정식

2011년 12월 5일 월요일

고유 함수의 완비성(Completeness of Eigenfunctions)

[경고] 아래 글을 읽지 않고 "고유 함수의 완비성"을 보면 바보로 느껴질 수 있습니다.
1. 스튀름–리우빌 이론
2. 푸리에 급수의 시작


스튀름–리우빌 이론(Sturm–Liouville theory)의 최종 목표는 푸리에 급수(Fourier series)를 이해하기이다. 푸리에 급수는 왜 수렴하며, 직교성(orthogonality)과 완비성(completeness)을 왜 가질까? 다른 함수도 이런 특성을 가지고 있는가? 1807년푸리에 39세, 조선 순조 시절에 등장한 푸리에 급수의 성공을 수학적으로 완벽하게 이해하기 위해 스튀름Jacques Charles François Sturm(1803–1855)은 1829년스튀름 26세, 조선 순조 시절부터 스튀름–리우빌 이론에 대한 다수의 논문을 발표한다. 1837년에는 리우빌과 함께 네 쪽짜리 논문을 썼다. 이 논문은 짧지만 스튀름–리우빌 이론의 정수를 보여준다[1]. 스튀름의 진동 정리(Sturm's oscillation theorem)를 쓰면 푸리에 급수가 가진 완비성을 모든 스튀름–리우빌 미분 방정식(Sturm–Liouville differential equation)으로 확장할 수 있다.

[고유 함수의 완비성]
고유치(eigenvalue) $\lambda_m$에 대한 직교 정규 고유 함수(orthonormal eigenfunction)가 $\psi_m$인 경우 제곱 적분 가능한 함수(square-integrable function) $f$는 고유 함수의 무한 급수로 항상 표현 가능하다.

                   (1)

여기서 내적(inner product)과 직교 정규 고유 함수는 다음과 같이 정의한다.

                       (2: 내적)

                       (3: 직교 정규 고유 함수)

                      (4: 크로네커 델타)

[증명]
고유 함수의 완비성 증명 시작은 식 (5)의 레일리 몫(Rayleigh quotient)이다[2].

   (5)

레일리 몫에 의해 고유치는 고유 함수의 내적으로 표현할 수 있다. 처음에 레일리 몫을 보면 의미없는 공식같지만 고유 함수의 완비성을 증명하는 새로운 길을 제시한다. 식 (6)의 스튀름 진동 정리를 적용한다.

                      (6)

스튀름의 진동 정리에 의해 고유치는 최소값을 반드시 가진다. 그래서 정칙 경계 조건(regular boundary condition)을 만족하는 임의의 함수 $f$를 식 (5)의 정의에 대입해서 다음 부등식을 얻는다.

                      (7)

여기서 $f$는 스튀름–리우빌 미분 방정식(Sturm–Liouville differential equation)을 만족하며 제곱 적분 가능(square integrable)해야 한다.

                      (8)

스튀름–리우빌 이론에서는 기본적으로 고유치를 선택한 상태에서 경계 조건을 만족하는 고유 함수를 고유치에 대응해서 구한다. 하지만 식 (7)의 시작점은 고유치가 아니고 우리가 고려하는 $f$이므로, 지금까지 쓰던 기본 방법론에서 약간 어긋나있다. 이후에 $f$에 대응하는 고유치 $\lambda_f$를 레일리 몫으로 찾는다. 이 $\lambda_f$는 식 (7)처럼 가장 작은 고유치 $\lambda_0$보다 크거나 같아야 한다. 왜냐하면 스튀름의 비교 정리(Sturm's comparison theorem)에 따라 정의 구간 내에서 영점 개수가 가장 작은 경우는 $\lambda_0$를 가진 $\psi_0$이고 $\lambda_f$를 품은 $f$의 변화가 $\psi_0$보다 느려질 수 없기 때문이다. 예를 들어, $f(x)$ = $\psi_i(x) + \psi_j(x)$이고 $\lambda_i < \lambda_j$인 조건에서 식 (5)로 얻는 고유치는 $\lambda_f$ = $\lambda_i + \lambda_j$가 됨으로 인해 $\lambda_i < \lambda_f$를 얻는다.[식 (5)로 계산할 필요없이 각 고유 함수에 대한 스튀름–리우빌 미분 방정식을 더한 후에 $\psi_i(x) + \psi_j(x)$로 내적을 적용해서 $\lambda_f$를 더 쉽게 정할 수 있다.] 결국 레일리 몫은 $f$의 고유치를 생성하는 연산이므로, 스튀름–리우빌 미분 방정식이 성립하는 $f$가 얻을 수 있는 고유치는 $\lambda_0$보다 작아질 수 없다. 다음 단계로 함수 $f$와 관계되지만 고유 함수 $\psi_0$의 영향은 없는 함수를 $g_0$이라 한다. 이를 통해 $g_0$의 단순한 표현식을 도출한다.

                      (9)

마찬가지로 함수 $g_0$와 관계되지만 고유 함수 $\psi_1$의 영향이 없는 함수는 식 (9)와 유사하게 $g_1$로 정의할 수 있다. 이 과정을 계속 반복해서 $\psi_0, \psi_1, \cdots, \psi_M$의 영향이 없는 함수 $g_M$을 다음처럼 규정한.

                      (10)

또 하나 생각할 부분은 $g_M$이 $\psi_0, \psi_1, \cdots, \psi_M$의 영향이 없기 때문에 식 (5)와 (7)에 의해 다음 부등식이 성립하게 된다.

                      (11)

여기서 $g_M$은 $\lambda_0, \lambda_1, \cdots, \lambda_M$과 관계가 없어서 $g_M$의 레일리 몫은 $\lambda_{M+1}$보다 항상 크거나 같아야 한다. 또한 식 (11)의 우변에 있는 내적의 의미를 파악한다.

                      (12)

                      (13)

여기서 $M_0$는 고유치 $\lambda_m$이 (-)인 최대 정수이다. 즉, $m \le M_0$이면 $\lambda_m \le 0$이다.
식 (12)와 (13)을 식 (11)에 대입하고 정리하면 다음과 같다[2].

              (14)

식 (6)의 스튀름 진동 정리에 의해 고유치는 무한대로 커져서 $M$이 무한대로 커질 때에 식 (14)의 우변은 0으로 수렴한다. 그래서 $E_M$이 0으로 수렴하므로 고유 함수의 완비성인 식 (1)이 항상 성립한다.
______________________________

이로써 푸리에 급수를 포함한 스튀름–리우빌 이론의 고유 함수는 탄탄한 수학적 기초위에 서있을 수 있다. 이런 이유로 공학 수학 시간에 스튀름–리우빌 이론을 배운다. 왜냐하면 스튀름–리우빌 이론을 통해 고유 함수의 무한 급수로 임의의 함수를 쉽게 표현할 수 있기 때문이다. 푸리에 급수와 같은 고유 함수의 무한 급수를 처음 보면 고유 함수를 무한히 더해서 임의의 함수를 표현하는 절차가 매우 신기해보인다. 그다음에는 책에서 맞다니까 무작정 고유 함수의 무한 급수 특성을 외우게 된다. 그런데 이렇게 해서는 발전이 없다. 자기 신념과 확신이 필요하다. 위의 증명을 따라올 수 있으면 푸리에 급수를 마음속으로부터 완벽히 이해하게 되고 더 나아가 스튀름–리우빌 미분 방정식이 만드는 고유 함수의 무한 급수 특성까지 알 수 있다.
식 (12)를 이용하면 $m$이 커질 때 무한 급수의 계수인 $a_m$의 특성을 유도할 수 있다. 식 (12)에서 고유치와 계수의 무한 급수는 반드시 수렴해야 하므로, 다음 관계가 성립한다.

                      (15)

따라서, $m$이 커질 때 $a_m$은 커지지 않고 항상 $\tau_a$의 속도로 작아진다.
푸리에 급수 전개처럼 식 (1)을 다음 적분으로 표현할 수 있다.

                     (16)

식 (16)은 어떤 연속 함수에 대해서도 성립하므로 $f(x)$를 상수 함수(constant function)라 생각하면 다음을 얻을 수 있다.

                     (17)

식 (16)과 (17), 디랙 델타 함수(Dirac delta function) 정의를 이용하면, 고유 함수로 만든 무한 급수를 델타 함수로 표현할 수 있다.

                     (18)

[그림 1] 불연속 함수(출처: wikipedia.org)

[그림 1]과 같은 불연속 함수(discontinuous function)를 고유 함수로 표현하면 어떻게 될까? 함수의 불연속성을 고유 함수로 표현할 수 있을까? 당연히 표현할 수 없다. 함수가 불연속인 점에서는 고유 함수의 무한 급수로 표현할 수 없다. 그렇다 하더라도 식 (1)이 틀렸다고 볼 수는 없다. 실제로는 고유 함수의 완비성을 아래와 같은 적분 형태로 표현하기 때문이다.

                     (19)

표현식이 적분이므로 어느 한 점에서 $f(x)$와 $S_M(x)$가 같지 않더라도 여전히 적분값은 0이다. 그러면, 불연속점에서는 고유 함수의 무한 급수가 어떤 값을 가지는가? 이를 이해하기 위해 불연속성을 아래처럼 연속성의 극한으로 생각한다.

                      (20)

여기서 $\Delta x$가 0으로 가면 우리가 원하는 불연속성이 얻어진다. 또한, 테일러 급수(Taylor series)로 인해 $\Delta x$가 아주 작을 때는 모든 함수 $f(x)$의 적절한 근사가 식 (20)이 된다. $\Delta x \ne 0$일 때에 함수 $f(x)$는 여전히 연속해서 식 (1)에 증명한 고유 함수의 완비성이 성립한다. 만약 $\Delta x$가 0으로 한없이 가까이 가면 $x$ $\approx$ $x_0$이므로, 식 (20)에 의해 고유 함수의 무한 급수는 $f(x_0)$ = $(f_r + f_l)/2$에 수렴한다. 즉, 불연속점에서는 좌극한($f_l$)과 우극한($f_r$)의 평균에 수렴한다. 조금 다른 각도로 보면 $\Delta x$가 아무리 바뀌더라도 함수값이 변하지 않는 고정점이 $x$ = $x_0$이며 고유 함수의 무한 급수는 고정점인 $f(x_0)$ = $(f_r + f_l)/2$로 수렴한다. 대충 생각하면 어떤 $\Delta x$에 대해서도 $f(x_0)$ = $(f_r + f_l)/2$를 만족해서 $\Delta x \to 0$인 경우에도 $f(x_0)$는 고정된다.

[참고문헌]
[1] W. O. Amrein, A. M. Hinz, D. B. Pearson, SturmLiouville Theory: Past and Present, Birkhäuser Basel, 2005.
[2] R. D. Costin, Completeness of the Eigenfunctions, SturmLiouville Theory, 2010. (방문일 2011-12-05)

[다음 읽을거리]
1. 고유치가 복소수인 스튀름–리우빌 이론