2011년 11월 16일 수요일

스튀름–리우빌 이론(Sturm–Liouville Theory)

[경고] 아래 글을 읽지 않고 "스튀름리우빌 이론"을 보면 바보로 느껴질 수 있습니다.
1. 미분 방정식의 의미
2. 선형 상미분 방정식
3. 푸리에 급수의 시작


[그림 1] 미분 방정식으로 해석한 공기의 흐름(출처: wikipedia.org)

미분 방정식(differential equation) 이론에 등장하는 프로베니우스 방법(Frobenius method)이 단순하면서도 참신하다면 스튀름–리우빌 이론(Sturm–Liouville theory)은 거대하다. 미분 방정식 이론은 규칙도 별로 없고 거의 중구난방으로 해법이 등장하는게 일반적이지만, 모든 2계 선형 상미분 방정식(the second order linear ordinary differential equation)의 해를 예측할 수 있는 스튀름–리우빌 이론은 단순하며 아름답기까지 하다. 이렇게 아름다운 이론이 사람 머리 속에서 나왔다는 사실이 믿어지지 않는다. 열심히 공부해서 스튀름–리우빌 이론의 참맛을 함께 느껴보자. 스튀름–리우빌 미분 방정식(Sturm–Liouville differential equation)은 아래처럼 표현된다.

                        (1)

여기서 $\lambda$는 상수, $p(x), q(x), r(x)$는 실수인 함수(real function)로 가정한다. 함수 $p(x)$는 미분 가능해야 하고[$\because$ 식 (1)을 보면 $p(x)$가 미분 안에 있다.] $q(x)$는 특별한 제약이 없다. 또한 밀도 함수(density function) 혹은 가중치 함수(weighting function)인 $r(x)$는 전체 구간에서 항상 $0$보다 크다고 가정한다. $r(x) > 0$인 가정을 한 이유는 식 (3.1) 때문이다. 식 (1)은 2계 선형 상미분 방정식치고는 모양이 이상하지만 두번 미분이 있는 2계 미분 방정식임은 분명하다. 한가지 드는 의문은 식 (1)이 모든 2계 선형 상미분 방정식을 표현할 수 있는가이다. 신기하게도 식 (1)은 식 (2)에 제시한 2계 선형 상미분 방정식을 표현할 수 있다. 보통 적분 인자(integrating factor)를 이용해서 이런 특성을 증명한다.

                       (2)

                       (3)

여기서 $m(x)$는 적분 인자이다. 식 (3)을 식 (2)에 대입하면 다음 식을 얻는다.

                       (4)

즉, 식 (1)에 있는 $p(x)$는 적분 인자 $m(x)$를 표현한다. 뛰어난 수학자인 스Jacques Charles François Sturm(1803–1855)과 리우빌Joseph Liouville(1809–1882)이 일반적인 식 (2) 대신에 특수한 식 (1)을 고민한 이유는 무엇일까? 사실 스튀름–리우빌 미분 방정식만 이해하고 있으면 공학 분야에 나오는 대부분의 미분 방정식을 두려움없이 대할 수 있다. 스튀름–리우빌 이론을 모른 채 학부과정을 졸업한다는 말은 수학 분야를 포기했다는 뜻이다. 그 만큼 스튀름–리우빌 이론은 중요하다. 스튀름–리우빌 이론의 위대한 점은 미분 방정식을 풀지 않고 해답의 특성을 알 수 있음이다. 얼마나 대단한가 풀지 않고 답의 특성을 안다니... 공학 분야에 쓰이는 대부분의 미분 방정식은 스튀름–리우빌 미분 방정식 형태이기 때문에 거의 모든 공학 분야 미분 방정식의 해 특성을 스튀름–리우빌 이론을 통해 이해할 수 있다.
연산자(operator)에 기반해서 미분 방정식인 식 (1)을 다음처럼 간결하게 표현할 수도 있다.

                        (5)

식 (5)의 넷째줄은 아주 재미있는 개념을 포함하고 있다. 페이저(phasor) 개념처럼 생각한다면 연산자 $\mathfrak D$는 $\lambda r(x)$와 같다. 그래서, 상수인 $\lambda$는 식 (1)의 고유치(eigenvalue)라고 부른다. 식 (1)처럼 고유치는 가중치 함수와 밀접하게 연결되어 있다.[고유치는 상수여서 $\lambda$값 자체는 여러 개 있을 수 있다. 하지만, 가중치 함수는 함수이므로 미분 방정식이 정해지면 하나로 딱 결정된다.] 다시 말하면, 고유치와 가중치 함수는 주어진 미분 방정식의 특성을 내포하고 있는 스칼라값과 함수가 된다.
[그림 2] 미분 방정식의 경계 조건(출처: wikipedia.org)

또한 미분 방정식이 제대로 구성되기 위해서는 초기 조건(initial condition)이 필요하니 다음과 같은 일반화된 조건을 도입한다.

                        (6)

사실 식 (6)은 어떤 함수의 초기값을 설정한다는 의미보다 양쪽 끝점의 값[$x$ = $a$와 $x$ = $b$]을 고정한다는 뜻이므로, [그림 2]처럼 미분 방정식의 경계 조건(boundary condition)이라 부를 수 있다. 그래서 식 (6)을 이라 부른다. 혹은 기여자 경계 조건이 식 (6)처럼 정의된 미분 방정식은 정칙 스튀름–리우빌 미분 방정식(regular Sturm–Liouville DE)이라 한다. 일반화된 식 (6)은 정칙 경계 조건(regular boundary condition) 혹은 제3형 경계 조건(third-type boundary condition)이라 한다. 기여자 이름을 따서 로뎅 경계 조건(Rodin boundary condition)이라 할 수도 있고, 물리학에서는 임피던스 경계 조건(impedance boundary condition)[5], 복사 조건(radiation condition) 등으로도 부른다.
식 (6)에서 $\alpha'$ = $\beta'$ = $0$이면 $y(a)$ = $y(b)$ = $0$이 된다.[물론 $\alpha \ne 0$, $\beta \ne 0$] 이 경우는 양쪽 경계점에서의 값을 정하므로 접선 경계 조건(tangential boundary condition)이 된다. 수학자 디리클레Peter Gustav Lejeune Dirichlet(1805–1859) 이름을 따서 디리클레 경계 조건(Dirichlet boundary condition)이라고도 한다. 혹은 식 (6)에서 $\alpha$ = $\beta$ = $0$이면 $y'(a)$ = $y'(b)$ = $0$이 성립한다.[물론 $\alpha' \ne 0$, $\beta' \ne 0$] 이 경우는 양쪽 경계점을 벗어나는 특성을 정하므로[∵ 경계점의 미분이 $0$이므로 $y(a), y(b)$는 $0$이 되지 않고 경계점 바깥으로 계속 뻗어갈 수 있다. 즉 기울기만 같다면 경계점 근방의 함수값은 어떤 값이든 가능하다.] 법선 경계 조건(normal boundary condition)이라 한다. 다른 말로 수학자 노이만Carl Neumann(1832–1925) 이름을 붙여서 노이만 경계 조건(Neumann boundary condition)이라 부르기도 한다. 접선 및 법선 경계 조건이 모두 다 부여된 경우는 코쉬 경계 조건(Cauchy boundary condition)이란 명칭을 쓴다. 음파(音波, acoustic wave)를 사용하는 응용에서는 좀더 직관적으로 경계 조건을 표현한다. 소리를 흡수하는 연성 표면(軟性表面, soft surface)에서 속도 $v$가 0이 되는 연성 경계 조건(soft boundary condition) $v$ = $0$은 디리클레 경계 조건과 동일하다. 비슷하게 소리를 튕기는 경성 표면(硬性表面, hard surface)은 속도의 미분이 0이 되는 경성 경계 조건(hard boundary condition) $\partial v / \partial n$ = $0$을 사용한다. 이 경성 경계 조건은 노이만 경계 조건과 같은 뜻이다. 전자파에 쓰이는 연성과 경성 경계 조건은 PEC(완전 전기 도체, perfect electric conductor)가 기준이다[6]. PEC 표면에서 전기장의 접선 성분 $E_t$는 0이 되므로[$E_t$ = $0$], 연성 경계 조건은 접선 경계 조건이다. 반면에 접선 자기장 $H_t$는 표면에 수직인 방향으로 변화가 없어서[$\partial H_t / \partial n$ = $0$], 법선 경계 조건이 바로 경성 경계 조건이다.
스튀름–리우빌 이론을 전개하기 위해 고유 함수를 정의한다. 먼저 고유치 $\lambda_m$이 주어진 경우 식 (1)을 만족하는 해를 $\psi_m(x)$라 한다. 그러면 $\psi_m(x)$는 고유 함수(eigenfunction)가 된다.


   1. 자기 수반성(self-adjointness)   

                       (1.1)

[증명]
자기 수반성(自己隨伴性, self-adjointness)은 식 (1.1)처럼 미분 연산자(differential operator) $\mathfrak D$ 주위의 함수[$\psi_m$와 $\psi_n$]를 서로 바꾸어도 동등한 관계가 성립함이다. 먼저 미분 규칙을 이용해 다음 특성을 얻는다.

            (1.2)

여기서 $W(u, v)$는 다음처럼 정의되는 함수 행렬식(Wronskian)이다.

                       (1.3)

식 (1.2)는 라그랑주의 항등식(Lagrange's identity)이라 불리며, 식 (1.2)를 적분한 식은 그린의 공식(Green's formula)이라 명한다. 이에 따라 식 (1.2)를 $a$에서 $b$까지 적분해서 그린의 공식을 유도한다.

                       (1.4)
______________________________

식 (1.4)의 첫째식이 성립하는 이유를 이해하려면 $x$ = $a$에 대해 아래 행렬(matrix)을 고려해야 한다.

                       (1.5)

식 (1.5)의 행렬식(determinant)이 $0$이 아니면, 당연히 역행렬(inverse matrix)을 구할 수 있어서 $\alpha$ = $\alpha'$ = $0$이 된다. 하지만 이런 경계 조건은 의미가 없으므로, 행렬식은 반드시 $0$이 되어야 한다. 점 $x$ = $b$에 대해서도 마찬가지의 유도를 할 수 있다.


   2. 직교성(orthogonality)   

                       (2.1)

[증명]

         (2.2)
______________________________

고유 함수 $\psi_m(x)$로 무한 급수를 만들기 때문에, 적분 $\int_a^b [\psi_m(x)]^2 r(x)\,dx$는 유한하도록 $r(x)$가 선택되어야 한다. 이 적분이 존재한다는 전제로 $r(x)$는 특정한 위치에서 발산할 수도 있다.[예를 들어, 르장드르의 미분 방정식(Legendre's differential equation)을 확인한다. 함수 $r(x)$가 발산하더라도 스튀름–리우빌 이론은 잘 성립한다.]
식 (2.1)의 직교성(直交性, orthogonality)은 무척 낯이 익다. 이 방식은 바로 푸리에 급수(Fourier series)에서 썼던 기법이다. 기록에는 없지만 스튀름이 스튀름–리우빌 이론을 발전시킨 이유가 푸리에 급수에 있을 것이다.[∵ 스튀름과 리우빌은 푸리에가 교수로 있었던 프랑스 이공과대학(École Polytechnique)과 관계가 깊다. 스튀름은 푸리에의 조수였다가 이공과대학의 교수가 되었다. 리우빌은 이공과대학을 졸업하고 그 대학 교수가 되었다.] 삼각 함수(trigonometric function)로 구성된 푸리에 급수가 왜 이리 성공적인가? 삼각 함수가 특별해서 이럴까? 아니면 푸리에 급수 자체가 특별한가? 스튀름은 스스로 이 답을 찾았다. 바로 식 (1)의 미분 방정식이 답이었다. 삼각 함수는 $p(x)$ = $1$, $q(x)$ = $0$, $r(x)$ = $1$인 경우의 해가 되어 삼각 함수는 이 미분 방정식의 고유 함수가 된다. 따라서, 푸리에 급수의 모든 성질이 당연히 성립하게 된다. 다른 말로 하면 푸리에 급수의 일반화가 스튀름–리우빌 이론이다.


   3. 고유치는 실수(realness of eigenvalue)   

경계 조건이 고정된 경우, 스튀름–리우빌 미분 방정식의 고유치는 항상 실수이다.

[증명]
증명을 위해 고유 함수 $\psi_m$의 켤레 복소수(complex conjugate) $\psi_m^*$도 경계 조건을 만족한다고 가정한다.[∵ $\alpha, \alpha', \beta, \beta'$가 복소수일 수 있기 때문이다.] 그러면 고유 함수 $\psi_m^*$에 대한 고유치는 $\lambda_m^*$이며 관련된 미분 방정식은 아래처럼 표현된다.

                       (3.1)

여기서 $(\cdot)^*$는 켤레 복소수, $p(x), q(x), r(x)$는 실수인 함수(real function)이다. 또한 $r(x) > 0$이라 가정하기 때문에 식 (3.1)의 적분은 항상 $0$보다 크다.
______________________________

위 증명에서 $\psi_m^*$가 만족해야 하는 경계 조건이 있다. 이를 상수 $\alpha, \alpha'$ 관점에서 써본다. 먼저 식 (6)의 첫째식에 켤레 복소수를 취하면 다음과 같다.

                       (3.2)

여기서 $\Im[\cdot]$은 복소수의 허수부이다. 식 (3.2)의 최종 결과는 무척이나 복잡하다. 그래서 일반성은 떨어지지만 편리하므로 $\alpha, \alpha', \beta, \beta'$을 실수로 가정해버린다. 그러면 식 (2.1)의 직교성을 켤레 복소수 관점으로 간편하게 쓸 수 있다.

                       (3.3)

하지만 $\alpha, \alpha', \beta, \beta'$를 실수라고만 가정하면 전자파 문제에 등장하는 임피던스 경계 조건(impedance boundary condition)[5]을 다룰 때 문제가 있으므로, 필요한 경우에만 $\alpha, \alpha', \beta, \beta'$를 실수라고 가정하며 본문에도 명기할 것이다.


   4. 아벨의 항등식(Abel's identity): 함수 행렬식은 상수(constant Wronskian)  

                       (4.1)

여기서 $\alpha, \alpha', \beta, \beta'$는 실수이다.

[증명]
식 (1.2)와 식 (2.2)를 연립하면 다음을 얻는다.

                   (4.2)

식 (4.2)에 식 (3.1)의 결과(혹은 고유치는 실수라는 결과)를 대입하고 적분하면 식 (4.1)이 얻어진다.
______________________________

                     (4.3)

식 (4.3)처럼 함수 행렬식을 구성할 때 켤레 복소수를 제외하고 $\psi_m, \psi_n$만 사용하면 $\alpha, \alpha', \beta, \beta'$가 실수라는 가정은 필요 없어진다.[∵ 켤레 복소수 연산을 사용하지 않았기 때문에 $m$ = $n$인 경우 당연히 $\lambda_m$ = $\lambda_n$] 즉, $\alpha, \alpha', \beta, \beta'$가 복소수라도 식 (4.3)은 성립한다.


   5. 해의 유일성(uniqueness of solutions)    [1]

고유치가 동일하면 경계 조건을 만족하는 고유 함수들은 상수배만 차이난다.

[증명]
동일한 고유치 $\lambda$에 대해 서로 다른 고유 함수 $\psi_1, \psi_2$가 존재한다고 가정한다. 고유치가 동일하기 때문에 식 (4.3)에 있는 아벨의 항등식을 사용할 수 있다.

                       (5.1)

______________________________

식 (5.1)에서 함수 행렬식이 $0$이 되는 이유는 식 (1.5)로부터 분명하다. 식 (1.5)에 의해 $x$ = $a$에서 함수 행렬식이 $0$이므로 $x$가 정의된 전체 구간에서 식 (5.1)의 첫째줄이 성립한다. 그러면 함수 행렬식을 풀어 식 (5.1)의 최종 결과를 얻을 수 있다. 다시 말해 고유치와 고유 함수는 식 (5.1)에 의해 일대일 대응이 되므로 고유치를 이용해서 고유 함수를 손쉽게 표현할 수 있다.


   6. 두번째 해(the second solution)    [1]

                       (6.1)

여기서 $\psi_1$은 이미 알고 있는 첫번째 해이며 $\psi_2$는 두번째 해이다.

[증명]
$\psi_1, \psi_2$의 경계 조건이 같다면 식 (5.1)과 같은 결론이 얻어진다. 두번째 해에 대한 경계 조건이 주어지지 않으면 식 (4.3)부터 출발해 답을 구해야 한다.

                       (6.2)
______________________________

식 (6.1)을 조금 더 간단하게 표기할 수도 있다.

                  (6.3)

여기서 $P(x)$는 식 (2)처럼 정의하며, $p(x)$는 식 (2)의 적분 인자이다.


   7. 레일리 몫(Rayleigh quotient)   

      (7.1)

[증명]
다음과 같은 정의를 이용해서 식 (5)에 부분 적분(部分積分, integration by parts)을 적용하면 쉽게 증명된다.

                       (7.2)
______________________________

식 (7.2)는 벡터의 내적(inner product)을 확장한 함수상 내적(inner product on functions)의 정의이다. 식 (7.1)의 레일리 몫은 고유치를 추정할 때 유용하게 사용될 수 있다. 예를 들어 고유치가 $0$인 경우는 $q(x)$ = $0$, $\psi_m'(x)$ = $0$이다. 여기서 $\psi_m'(x)$ = $0$은 $\psi_m(x)$가 상수라는 조건이다. 또한 고유치가 $0$보다 항상 크려면, 식 (7.1)의 분자는 항상 양수가 되어야 한다.


[그림 8.1] 동일한 고유치를 가진 고유 함수의 움직임(출처: wikipedia.org)

   8. 스튀름의 분리 정리(Sturm's separation theorem)    [2]

(8a) 고유 함수의 영점(zero)은 유한하다.
(8b) 고유 함수의 영점은 단순근(simple root)이다.
(8c) 동일한 고유치를 가진 서로 독립인 고유 함수를 $\psi_1, \psi_2$라 한다. $\psi_1$의 영점 사이에는 $\psi_2$의 영점이 반드시 하나만 존재한다.

[명제 (8a)의 증명]
고유 함수의 영점이 무한하다고 가정한다. 그러면 어떤 수열(數列, sequence) $\{x_n\}$이 무한히 존재해서 $\psi(x_n)$ = $0$을 만족해야 한다. 또한 $n$이 커질 때 $\{x_n\}$의 수렴점을 $x_c$라 정의한다.[$\because$ $x$는 구간 $[a, b]$ 내에 존재해야 하므로 발산할 수 없다.] 결과적으로 다음이 항상 성립한다.

                       (8.1)

점 $x$ = $x_c$를 시점으로 피카르의 반복법(Picard's iteration method)을 적용하면 $\psi(x)$ = $0$이 나온다. 이 해는 의미없기 때문에 고유 함수의 영점은 유한해야 한다.

[명제 (8b)의 증명]
영점 부근에서 $\psi(x)$ = $c(x-x_n)$처럼 움직이면 단순근이라 한다. 여기서 $c$는 상수이다. 만약 $\psi(x)$ = $c(x-x_n)^2$이라면, $x$ = $x_n$에서의 미분값이 $0$이 된다. 명제 (8a) 증명처럼 $x$ = $x_n$을 시작으로 피카르의 반복법을 적용하면 $\psi(x)$ = $0$이 나온다. 이 해는 의미없기 때문에 고유 함수의 영점은 단순근이어야 한다.

[명제 (8c)의 증명]
명제 (8c)는 [그림 8.1]을 보면 명확하다. 빨간색 함수의 영점 사이에 초록색 함수의 영점이 반드시 존재한다. 증명을 위해 $\psi_1$의 영점을 $x_0$과 $x_1$[$x_0 < x_1$]이라 한다. 고유 함수 $\psi_2$는 구간 $[x_0, x_1]$에서 영점이 없다고 생각한다. 그러면 함수 $\psi_1/\psi_2$는 롤의 정리(Rolle's theorem)에 의해 다음 성질을 가진다.

                       (8.2)

여기서 $\xi$는 구간 $[x_0, x_1]$ 사이에 있는 어떤 값이며 분모를 구성하는 $\psi_2$는 $[x_0, x_1]$에서 영점이 없기 때문에 함수 $\psi_1/\psi_2$는 잘 정의된다. 이 경우 식 (8.2)의 둘째식이 성립하기 때문에 $\psi_1, \psi_2$는 서로 종속 관계여야 하나 조건에서는 서로 독립이므로 $\psi_2$는 구간 $[x_0, x_1]$에서 영점을 가져야 한다. 만약 $\psi_2$가 구간 $[x_0, x_1]$에서 두개의 영점을 가진다면 식 (8.2)와 유사한 논증에 의해 모순이 발생한다. 따라서 $\psi_2$는 반드시 하나의 영점만 가져야 한다.[∵ $\psi_2$의 두 영점 사이에서는 $\psi_1$이 영점을 가지지 않으므로 식 (8.2)에 적용한 동일한 논리를 $\psi_1$에 적용하면 모순을 얻을 수 있다.]
______________________________

스튀름의 분리 정리에서 영점에 집중한 이유는 고유 함수의 진동(振動, oscillation) 특성을 볼 수 있기 때문이다. 고유 함수의 진동은 고유치와 밀접한 관계를 가진다.


[그림 9.1] 함수의 영점(출처: wikipedia.org)

   9. 스튀름의 비교 정리(Sturm's comparison theorem)   

만약 $\lambda_2 > \lambda_1$이면 $\psi_1$의 영점 사이에 $\psi_2$의 영점이 적어도 하나 이상 존재한다. 여기서 고유치와 고유 함수는 $(\lambda_1, \psi_1)$$(\lambda_2, \psi_2)$와 같은 쌍을 이루며 $p(x)$는 $\psi_1$의 영점 사이에서 부호를 바꾸지 않는다. 즉 고유치가 크면 고유 함수도 더 빨리 진동한다.

[증명]
스튀름의 분리 정리가 동일한 고유치에 대한 정리라면 비교 정리는 서로 다른 고유치에 대한 정리이다. 증명 방법은 분리 정리와 매우 유사하다. 식 (4.2)를 약간 변형한 다음식부터 출발해본다.

                       (9.1)

고유 함수 $\psi_1$의 영점을 $x_0$과 $x_1$[$x_0 < x_1$]이라 한다. 스튀름 분리 정리 (8b)의 단순근 특성을 보여주는 [그림 9.1]처럼 영점 사이에서는 ($+$)이거나 ($-$)이므로 편하게 $(x_0, x_1)$ 사이에서 $\psi_1$은 ($+$)라 가정한다.[$\because$ 단순근이므로 영점 근처에서는 $x$축을 지나는 직선처럼 생각할 수 있다.] $\psi_2$는 영점이 없으므로 편하게 $(x_0, x_1)$에서 ($+$)라 가정한다. 그러면 식 (9.1)의 우변은 항상 $0$보다 크다. 즉, $p(x)W(\psi_2, \psi_1)$은 구간 $(x_0, x_1)$에서 항상 증가하고 있다. 또한 $p(x)$가 구간 $(x_0, x_1)$에서 항상 0보다 크면 다음이 성립해야 한다.

                       (9.2)

그런데 $x$ = $x_0$에서 $p(x)W(\psi_2, \psi_1)$가 $0$보다 큰 상태에서 항상 증가하고 있는데 $x$ = $x_1$에서 $p(x)W(\psi_2, \psi_1)$가 $0$보다 작으면 모순이다. 그래서, $\psi_2$는 $(x_0, x_1)$에서 반드시 영점을 가져야 한다.
______________________________

스튀름의 비교 정리를 거꾸로 생각해보면 재미있다. 고유 함수 $\psi_2$가 $\psi_1$보다 빨리 변하므로 $\psi_2$의 영점 사이에 $\psi_1$의 영점이 없을 수도 있다. 진짜 그런지 식 (9.2)처럼 생각해본다. 논의를 위해 $\psi_2$의 영점은 $\chi_0$과 $\chi_1$[$\chi_0 < \chi_1$], 영점 사이에서 $\psi_1, \psi_2$는 항상 ($+$)라고 가정한다.

                    (9.3)

식 (9.1)에 의해 $x$ = $\chi_0$에서 $p(x)W(\psi_2, \psi_1)$는 항상 증가하고 있다. 하지만 식 (9.2)와 다르게 ($-$)에서 증가하고 있으므로 $x$ = $\chi_1$에서 ($+$)가 될 수도 있다. 예를 들어 $\lambda_2$와 $\lambda_1$이 너무 비슷하면 식 (9.1)에 의해 $p(x)W(\psi_2, \psi_1)$의 기울기는 거의 $0$이다. 즉, 식 (9.3)과는 모순이 되어 $\psi_2$의 영점 사이에 $\psi_1$의 영점이 반드시 있어야 한다. 이런 특성은 스튀름의 분리 정리와 동치이다. $\lambda_2$가 $\lambda_1$보다 매우 큰 경우는 $p(x)W(\psi_2, \psi_1)$의 기울기가 굉장히 크기 때문에 모순이 아니므로 $\psi_2$의 영점 사이에 $\psi_1$의 영점은 없다.

휴, 지금까지 상당히 먼 길을 왔다. 별 의미가 없을 것 같은 영점을 집요하게 고민하는 이유는 영점의 특성이 고유치 분포를 보여주기 때문이다. 고유치는 고유 함수와 일대일로 연결되어 있으므로 영점의 특성은 고유 함수의 분포를 정확히 보여준다. 이 부분이 스튀름–리우빌 이론의 핵심이다. 평범한 공학 수학책에는 없지만 수준 높은 수학책에는 스튀름의 분리와 비교 정리의 증명을 볼 수 있다. 하지만 책을 보더라도 왜 스튀름이 이 명제를 증명했는지, 어디에 쓰이는지 등은 알기 어렵다. 아마도 수학자는 구질구질한 설명을 싫어하기 때문일 것이다. 행간을 알고 싶은 사람은 이해될 때까지 수학 정리 증명을 읽고 또 읽어야 한다. 그래서, 수학자들은 독한놈을 좋아한다. 순한 놈은 나가떨어지지만 독한 놈은 끝까지 간다. 이런 성향이 강했던 독일 괴팅겐[정확한 발음은 괴팅엔이나 우리 전통에 따라 괴팅겐으로 표기] 대학교의 가우스Carl Friedrich Gauss(1777–1855) 교수는 학생에게 인기가 아주 없었다. 가우스가 주로 썼던 말이 잘 아는 바와 같이, 분명하므로[가우스에게 분명한 내용이 우리에게 그렇지 않을 확률이 99.9999...%] 등이었다는 풍문을 보면, 학생에게 친절한 설명을 해주지는 않았을 것이다. 하지만 학생이 가야 할 학자의 길을 가우스는 죽을 때까지 묵묵히 보여주었다. 이런 스승의 지독함과 고지식함을 갖추고 꿋꿋하게 연구해간 베셀(?), 데데킨트, 디리클레, 리만, 칸토르 등의 가우스 제자들은 수학책에 나올 정도의 굵직한 수학자가 되었다.
다음으로 스튀름–리우빌 이론이 만든 아름다운 정리인 스튀름의 진동 정리를 증명한다.


   10. 스튀름의 진동 정리(Sturm's oscillation theorem)   

정칙 경계 조건(regular boundary condition)을 만족하는 스튀름–리우빌 미분 방정식의 고유치는 다음 관계를 만족한다.

                       (10.1)

                      (10.2)

여기서 $N(\lambda)$는 고유치 $\lambda$의 영점 개수이다.

[증명]
정칙 경계 조건은 식 (6)에 있는 조건이다. 증명을 간단하게 하기 위해 $\psi(a)$ = $\psi(b)$ = $0$이라 가정한다. 또한 $\lambda_n$의 영점은 $a < x_0 < x_1 < x_2 \cdots < x_m < b$와 같이 구성된다고 생각한다. 그러면, 스튀름의 비교 정리에 의해 $\lambda_n$보다 큰 $\lambda_{n+1}$은 $\lambda_n$의 영점 사이에서 반드시 영점을 가져야 한다. $\lambda_{n+1}$의 영점의 개수를 헤아려보면 $\lambda_n$의 영점 개수보다 $1$이 크다. 그래서 식 (10.1)이 반드시 성립해야 한다. 식 (10.2)를 증명하기 위해 영점 개수의 특성을 본다. 식 (10.1)에 의해 고유치만 커진다면 영점 개수는 계속 커질 수 있다. 구간 $(a, b)$의 영점은 무한대로 많을 수 있기 때문에[많더라도 가산 집합(可算集合, countable set)이다.] 고유치도 계속 커져 무한대로 발산한다. 하지만 거꾸로 영점을 줄여가면 언젠가는 $N(\lambda)$ = $0$이 된다. 즉, 영점 개수가 하한선을 가지기 때문에 이 값이 고유치가 가질 수 있는 하한선이 된다. 따라서 고유치는 가장 작은 값에서부터 시작해서 계속 커져가게 된다.
지금까지 증명한 부분은 $\psi(a)$ = $\psi(b)$ = $0$인 경우이다. 식 (6)의 조건이 되면 어떻게 될까? 이 경우 증명 과정은 $x$ = $a, b$에 있는 끝점을 제외하고는 동일하다. 점 $x$ = $a$에서의 증명을 위해 비교 정리와 유사한 논법을 사용한다. 먼저 $\psi(a) \ne 0$이라 가정하고 $x$ = $a$와 가장 가까운 $\psi_1$의 영점을 $x_0$라 한다. 구간 $(a, x_0)$ 사이에서 $\psi_1$은 ($+$), $\psi_2$는 영점없이 ($+$)라 정한다. 하지만 식 (6)이 성립하므로 $x$ = $a$에서 $W(\psi_2, \psi_1)$ = $0$이 된다. 그러면 식 (9.2)와 유사하게 $x$ = $a$에서 $0$인 $p(x)W(\psi_2, \psi_1)$가 $x$ = $x_0$에서는 ($-$)가 되어야 한다. 하지만 $p(x)W(\psi_2, \psi_1)$는 증가하고 있으므로 모순이다. 따라서, $\psi_2$는 구간 $(a, x_0)$ 사이에 반드시 영점을 가져야 한다. 점 $x$ = $b$에서도 마찬가지이므로 증명이 완결된다.
______________________________

스튀름의 진동 정리에서 고유치 $\lambda_n$의 첨자 $n$이 계속 커질 때, 두 고유치의 차 $\epsilon_n$ = $\lambda_{n+1} - \lambda_n$은 $0$이 될 수 없다. 즉, $\lim_{n \to \infty} \epsilon_n$ $\ne$ $0$이 되어야 한다. 왜냐하면 고유치가 어떤 한 값 $\lambda_\omega$로 수렴하면, 이 값에 해당하는 고유 함수 $\psi_\omega (x)$는 $n$에 관계없이 동일해지기 때문이다. 이로 인해 각 고유 함수는 식 (2.1)에 증명한 직교성을 만족할 수 없어서 논리적 오류가 생긴다. 이 논리를 수학적으로 더 견고하게 만들기 위해, 고유 함수의 차 $d_n(x)$ = $\psi_{n+1}(x) - \psi_n(x)$를 정의해서 다음처럼 함수상 내적을 계산한다.

                      (10.3)

식 (10.3)에 따라 $n$이 다르면, 고유 함수 $\psi_n(x)$는 다른 고유 함수와 같을 수 없다. 추가적으로 $\lambda_{n+1}$과 $\psi_{n+1}(x)$를 $\lambda_{n}$과 $\psi_{n}(x)$의 관점으로 써서 식 (5)에 대입해서 다음 결과를 얻는다.

                      (10.4)

만약 $n$가 매우 커질 때 $\epsilon_n$이 $0$으로 수렴하면 $d_n$은 $\psi_{n+1}(x)$가 되어서 모순이 생긴다.

                      (10.5)

따라서 $\lim_{n \to \infty} \epsilon_n$ = $0$은 절대 성립할 수 없다.


   11. 정의역 비율 조정(domain scaling)   

정의역 구간을 동일한 비율로 확대하면, 확대된 미분 방정식의 고유치는 구간의 길이에 반비례하여 원래의 고유치보다 줄어든다. 반대로 정의역 구간을 축소하면, 고유치는 이전보다 더 커진다.

[증명]
정의역 $[a, b]$를 확대하기 위한 함수 관계는 $\tilde{x}$ = $\mu x$라고 한다. 여기서 $1$보다 큰 $\mu$는 정의역 구간을 확대한 비율이다. 식 $x$ = $\tilde{x}/\mu$를 식 (1)에 대입해서 정리한다.

                      (11.1)

여기서 $\mu > 1$, 정의역은 $[a, b]$에서 $[\mu a, \mu b]$로 확대된다. 식 (11.1)을 식 (1)처럼 다시 쓴다.

                      (11.2)

여기서 $\widetilde{p}(\tilde{x})$ = $p(x)$, $\widetilde{q}(\tilde{x})$ = $q(x)/\mu^2$, $\widetilde{r}(\tilde{x})$ = $r(x)$, $\widetilde{\psi}_m(\tilde{x})$ = $\psi_m(x)$이다. 따라서 원래 고유치 $\lambda_m$은 확대 비율 $\mu$에 반비례하여 $\widetilde{\lambda}_m$ = $\lambda_m / \mu^2$으로 축소된다. 
______________________________

스튀름–리우빌 미분 방정식의 정의역 비율 조정에 의해, 정의역 구간을 계속 늘려가면 고유치의 간격은 계속 줄어든다. 결국 정의역이 무한대로 커지면, 이산적인 식 (10.2)와 다르게 고유치는 연속적으로 변하게 된다.


[참고문헌]
[3] J. Lützen, "Sturm and Liouville's work on ordinary linear differential equations. The emergence of Sturm–Liouville theory," Archive for History of Exact Sciences, vol. 29, no. 4, pp. 309–376, 1984.
[4] C. A. Swanson (Ed.), Chapter 1. Sturm-Type Theorems for Second Order Ordinary Equations, Comparison and Oscillation Theory of Linear Differential Equations, New York, USA: Academic Press, 1968.
[5] T. B. A. Senior, "Impedance boundary conditions for imperfectly conducting surfaces," Appl. Sci. Res., B, vol. 8, no. 1, pp. 418–436, Dec. 1960.
[6] P.-S. Kildal, "Artificially soft and hard surfaces in electromagnetics,"IEEE Trans. Antennas Propag., vol. 38, no. 10, pp. 1537–1544, Oct. 1990.

[다음 읽을거리]
1. 고유 함수의 완비성
2. 베셀의 미분 방정식
3. 르장드르의 미분 방정식
4. 고유치가 복소수인 스튀름–리우빌 이론

1계 선형 상미분 방정식의 해법(Solution of the First Order Linear Ordinary Differential Equation)

[경고] 아래 글을 읽지 않고 "1계 선형 상미분 방정식"을 보면 바보로 느껴질 수 있습니다.
1. 미분 방정식의 의미
2. 선형 상미분 방정식
3. 완전 미분


선형 상미분 방정식(linear ordinary differential equation, linear ODE)은 일반적인 해법이 존재하지 않아서 각 경우마다 고민을 해서 새로운 풀이법을 찾아야 한다.

             (1)

하지만 1계() 선형 상미분 방정식(the first order linear ODE)인 경우는 일반 해법이 있다. 모든 경우에 적용되는 일반 해법의 핵심은 바로 적분 인자(integrating factor)이다. 적분 인자를 이해하기 위해서, 식 (1)의 미분 방정식에 $n$ = $1$을 대입하고 강제적으로 $m(x)$라는 함수를 곱한다.

                       (2)

우리 짐작대로 식 (2)에 곱한 $m(x)$가 적분 인자이다. 함수 $p(x)$가 주어진 경우, 미분 관계를 이용해 적분 인자를 구할 수 있다. 먼저 식 (2)의 둘째식에서 좌변만 집중하며 아래처럼 $m(x) y$의 미분을 기계적으로 구한다. 그런 다음에 강제적으로 이 두 식이 같다는 조건을 적용해서 적분 인자 $m(x)$를 결정한다.

                       (3)

식 (3)에서 구한 적분 인자 $m(x)$는 이미 정해진 함수 $p(x)$의 적분이므로, $m(x)$는 $p(x)$에 의해 딱 하나로 정해진다. 그 다음에 식 (2)의 좌변을 $m(x) y$의 미분으로 바꾼 후 단순 적분을 하면, 1계 선형 상미분 방정식의 일반해를 다음과 같은 부정적분으로 간단하게 표현할 수 있다.

                       (4)

식 (4)에 공식화한 해를 구체적으로 결정하려면, 식 (4)의 부정적분(indefinite integral)을 정적분(definite integral)해야 한다. 이때 필연적으로 나타나는 적분 상수는 초기값(initial value)이나 경계 조건(boundary condition) 등을 이용해 계산된다.
완전 미분(exact differential)을 도입해서 적분 인자 $m(x)$를 더 확장한 일반화 적분 인자(generalized integrating factor) $\mu(x, y)$를 정의할 수 있다[1].

                       (5)

여기서 $\phi(x, y)$ = $C$, $C$는 $x, y$에 대해 상수이다. 두 변수 $x, y$를 연결하는 함수 $\phi(x, y)$ = $C$가 있고 식 (5)의 첫째식이 완전 미분 방정식(exact differential equation)을 구성하므로, 일반화 적분 인자 $\mu(x, y)$는 아래처럼 항상 존재한다.

                       (6a)

                       (6b)

                       (6c)

함수 $\phi(x, y)$의 값어치는 $x, y$의 연결 관계에서 분명해진다. 원래 $y$ = $f(x)$이지만 완전 미분을 만들기 위해 $x, y$를 독립 변수로 취급한다. 다만 이 방식이 제대로 풀리려면 식 (5)만으로는 부족하고 방정식 하나가 더 있어야 $y$를 분명하게 정할 수 있다. 이때 사용되는 $x, y$의 연결 고리가 바로 $\phi(x, y)$이다. 또한 적분 인자는 유일하지 않고 무한대로 존재한다. 예를 들어, $\phi$를 입력 변수로 하는 함수 $M(\phi)$를 식 (6c)에 곱해본다.

                       (7)

우리가 $F(\phi)$를 곱하지만 $d\phi$ = $0$이라서, 실제로는 상수 함수 $F(C)$를 곱한 셈이다. 그러면 $F(\phi) \mu(x, y)$는 새로운 적분 인자 $\mu'(x, y)$로 작용한다. 따라서 우리 선택한 함수 $F(\phi)$의 임의성으로 인해 적분 인자는 유일하지 않고 무한하게 실재한다.
적분 인자가 존재한다고 해서 바로 구해진다는 뜻은 아니라서, $\mu(x, y)$에 대한 편미분 방정식(partial differential equation)이 필요하다. 완전 미분의 조건을 식 (5)의 둘째식에 적용해서 $\mu(x, y)$를 결정하기 위한 새로운 편미분 방정식을 하나 만든다.

                       (8)

만약 일반화 적분 인자를 $x$만의 함수라 생각해서 $\mu(x)$로 두면 식 (8)은 매우 간단해진다.

                       (9)

예를 들어, 식 (2)의 첫째식을 완전 미분 형태로 바꾸어서 식 (9)를 적용하면, 일반화 적분 인자 $\mu(x)$로부터 식 (3)에 유도한 적분 인자 $m(x)$가 그대로 도출된다.

                       (10)

여기서 $A(x, y)$ = $p(x) y - q(x)$, $B(x, y)$ = $1$, $m(x)$ = $\mu(x)$이다.

[참고문헌]
[1] E. L. Ince, Ordinary Differential Equations, New York: Dover Publications, 1926, pp. 27–29. (방문일 2022-11-13)

[다음 읽을거리]
1. 프로베니우스 방법의 적용
2. 스튀름–리우빌 이론