2011년 12월 5일 월요일

고유 함수의 완비성(Completeness of Eigenfunctions)

[경고] 아래 글을 읽지 않고 "고유 함수의 완비성"을 보면 바보로 느껴질 수 있습니다.
1. 스튀름–리우빌 이론
2. 푸리에 급수의 시작


[그림 1] 푸리에 급수의 완비성(출처: wikipedia.org)

스튀름–리우빌 이론(Sturm–Liouville theory)의 최종 목표는 푸리에 급수(Fourier series)를 이해하기이다. 푸리에 급수는 왜 수렴하며, 직교성(orthogonality)과 완비성(completeness)을 왜 가질까? 다른 함수도 이런 특성을 가지고 있는가? 1807년푸리에 39세, 조선 순조 시절에 등장한 푸리에 급수의 성공을 수학적으로 완벽하게 이해하기 위해 스튀름Jacques Charles François Sturm(1803–1855)은 1829년스튀름 26세, 조선 순조 시절부터 스튀름–리우빌 이론에 대한 다수의 논문을 발표한다. 1837년에는 리우빌과 함께 네 쪽짜리 논문을 썼다. 이 논문은 짧지만 스튀름–리우빌 이론의 정수를 보여준다[1]. 스튀름의 진동 정리(Sturm's oscillation theorem)를 쓰면 푸리에 급수가 가진 완비성을 모든 스튀름–리우빌 미분 방정식(Sturm–Liouville differential equation)으로 확장할 수 있다.

[고유 함수의 완비성]
고유치(eigenvalue) $\lambda_m$에 대한 직교 정규 고유 함수(orthonormal eigenfunction)가 $\psi_m$인 경우 제곱 적분 가능한 함수(square-integrable function) $f$는 고유 함수의 무한 급수로 항상 표현 가능하다.

                   (1)

여기서 내적(inner product)과 직교 정규 고유 함수는 다음과 같이 정의한다.

                       (2: 내적)

                       (3: 직교 정규 고유 함수)

                      (4: 크로네커 델타)

[증명]
고유 함수의 완비성 증명 시작은 식 (5)의 레일리 몫(Rayleigh quotient)이다[2].

   (5)

레일리 몫에 의해 고유치는 고유 함수의 내적으로 표현할 수 있다. 처음에 레일리 몫을 보면 의미없는 공식같지만 고유 함수의 완비성을 증명하는 새로운 길을 제시한다. 식 (6)의 스튀름 진동 정리를 적용한다.

                      (6)

스튀름의 진동 정리에 의해 고유치는 최소값을 반드시 가진다. 그래서 정칙 경계 조건(regular boundary condition)을 만족하는 임의의 함수 $f$를 식 (5)의 정의에 대입해서 다음 부등식을 얻는다.

                      (7)

여기서 $f$는 스튀름–리우빌 미분 방정식(Sturm–Liouville differential equation)을 만족하며 제곱 적분 가능(square integrable)해야 한다.

                      (8)

스튀름–리우빌 이론에서는 기본적으로 고유치를 선택한 상태에서 경계 조건을 만족하는 고유 함수를 고유치에 대응해서 구한다. 하지만 식 (7)의 시작점은 고유치가 아니고 우리가 고려하는 $f$이므로, 지금까지 쓰던 기본 방법론에서 약간 어긋나있다. 이후에 $f$에 대응하는 고유치 $\lambda_f$를 레일리 몫으로 찾는다. 이 $\lambda_f$는 식 (7)처럼 가장 작은 고유치 $\lambda_0$보다 크거나 같아야 한다. 왜냐하면 스튀름의 비교 정리(Sturm's comparison theorem)에 따라 정의 구간 내에서 영점 개수가 가장 작은 경우는 $\lambda_0$를 가진 $\psi_0$이고 $\lambda_f$를 품은 $f$의 변화가 $\psi_0$보다 느려질 수 없기 때문이다. 예를 들어, $f(x)$ = $\psi_i(x) + \psi_j(x)$이고 $\lambda_i < \lambda_j$인 조건에서 식 (5)로 얻는 고유치는 $\lambda_f$ = $\lambda_i + \lambda_j$가 됨으로 인해 $\lambda_i < \lambda_f$를 얻는다.[식 (5)로 계산할 필요없이 각 고유 함수에 대한 스튀름–리우빌 미분 방정식을 더한 후에 $\psi_i(x) + \psi_j(x)$로 내적을 적용해서 $\lambda_f$를 더 쉽게 정할 수 있다.] 결국 레일리 몫은 $f$의 고유치를 생성하는 연산이므로, 스튀름–리우빌 미분 방정식이 성립하는 $f$가 얻을 수 있는 고유치는 $\lambda_0$보다 작아질 수 없다. 다음 단계로 함수 $f$와 관계되지만 고유 함수 $\psi_0$의 영향은 없는 함수를 $g_0$이라 한다. 이를 통해 $g_0$의 단순한 표현식을 도출한다.

                      (9)

마찬가지로 함수 $g_0$와 관계되지만 고유 함수 $\psi_1$의 영향이 없는 함수는 식 (9)와 유사하게 $g_1$로 정의할 수 있다. 이 과정을 계속 반복해서 $\psi_0, \psi_1, \cdots, \psi_M$의 영향이 없는 함수 $g_M$을 다음처럼 규정한.

                      (10)

여기서 $m$ = $0, 1, 2, \cdots, M$이다. 또 하나 생각할 부분은 $g_M$이 $\psi_0, \psi_1, \cdots, \psi_M$의 영향이 없기 때문에 식 (5)와 (7)에 의해 다음 부등식이 성립하게 된다.

                      (11)

여기서 $g_M$은 $\lambda_0, \lambda_1, \cdots, \lambda_M$과 관계가 없어서 $g_M$의 레일리 몫은 $\lambda_{M+1}$보다 항상 크거나 같아야 한다. 또한 식 (11)의 우변에 있는 내적의 의미를 파악한다.

                      (12)

                      (13)

여기서 $M_0$는 고유치 $\lambda_m$이 ($-$)인 최대 정수이다. 즉, $m \le M_0$이면 $\lambda_m \le 0$이다.
식 (12)와 (13)을 식 (11)에 대입하고 정리하면 다음과 같다[2].

              (14)

식 (6)의 스튀름 진동 정리에 의해 고유치는 무한대로 커져서 $M$이 무한대로 커질 때에 식 (14)의 우변은 0으로 수렴한다. 그래서 $E_M$이 0으로 수렴하므로 고유 함수의 완비성인 식 (1)이 항상 성립한다.
______________________________

이로써 푸리에 급수를 포함한 스튀름–리우빌 이론의 고유 함수는 탄탄한 수학적 기초위에 서있을 수 있다. 이런 이유로 공학 수학 시간에 스튀름–리우빌 이론을 배운다. 왜냐하면 스튀름–리우빌 이론을 통해 고유 함수의 무한 급수로 임의의 함수를 쉽게 표현할 수 있기 때문이다. 푸리에 급수와 같은 고유 함수의 무한 급수를 처음 보면 고유 함수를 무한히 더해서 임의의 함수를 표현하는 절차가 매우 신기해보인다. 그다음에는 책에서 맞다니까 무작정 고유 함수의 무한 급수 특성을 외우게 된다. 그런데 이렇게 해서는 발전이 없다. 자기 신념과 확신이 필요하다. 위의 증명을 따라올 수 있으면 푸리에 급수를 마음속으로부터 완벽히 이해하게 되고 더 나아가 스튀름–리우빌 미분 방정식이 만드는 고유 함수의 무한 급수 특성까지 알 수 있다.
식 (12)를 이용하면 $m$이 커질 때 무한 급수의 계수인 $a_m$의 특성을 유도할 수 있다. 식 (12)에서 고유치와 계수의 무한 급수는 반드시 수렴해야 하므로, 다음 관계가 성립한다.

                      (15)

따라서, $m$이 커질 때 $a_m$은 커지지 않고 항상 $\tau_a$의 속도로 작아진다.
푸리에 급수 전개처럼 식 (1)을 다음 적분으로 표현할 수 있다.

                     (16)

식 (16)은 어떤 연속 함수에 대해서도 성립하므로 $f(x)$를 상수 함수(constant function)라 생각하면 다음을 얻을 수 있다.

                     (17)

식 (16)과 (17), 디랙 델타 함수(Dirac delta function) 정의를 이용하면, 고유 함수로 만든 무한 급수를 델타 함수로 표현할 수 있다.

                     (18)

[그림 1] 불연속 함수(출처: wikipedia.org)

[그림 1]과 같은 불연속 함수(discontinuous function)를 고유 함수로 표현하면 어떻게 될까? 함수의 불연속성을 고유 함수로 표현할 수 있을까? 당연히 표현할 수 없다. 함수가 불연속인 점에서는 고유 함수의 무한 급수로 표현할 수 없다. 그렇다 하더라도 식 (1)이 틀렸다고 볼 수는 없다. 실제로는 고유 함수의 완비성을 아래와 같은 적분 형태로 표현하기 때문이다.

                     (19)

표현식이 적분이므로 어느 한 점에서 $f(x)$와 $S_M(x)$가 같지 않더라도 여전히 적분값은 0이다. 그러면, 불연속점에서는 고유 함수의 무한 급수가 어떤 값을 가지는가? 이를 이해하기 위해 불연속성을 아래처럼 연속성의 극한으로 생각한다.

                      (20)

여기서 $\Delta x$가 0으로 가면 우리가 원하는 불연속성이 얻어진다. 또한, 테일러 급수(Taylor series)로 인해 $\Delta x$가 아주 작을 때는 모든 함수 $f(x)$의 적절한 근사가 식 (20)이 된다. $\Delta x \ne 0$일 때에 함수 $f(x)$는 여전히 연속해서 식 (1)에 증명한 고유 함수의 완비성이 성립한다. 만약 $\Delta x$가 0으로 한없이 가까이 가면 $x$ $\approx$ $x_0$이므로, 식 (20)에 의해 고유 함수의 무한 급수는 $f(x_0)$ = $(f_r + f_l)/2$에 수렴한다. 즉, 불연속점에서는 좌극한($f_l$)과 우극한($f_r$)의 평균에 수렴한다. 조금 다른 각도로 보면 $\Delta x$가 아무리 바뀌더라도 함수값이 변하지 않는 고정점이 $x$ = $x_0$이며 고유 함수의 무한 급수는 고정점인 $f(x_0)$ = $(f_r + f_l)/2$로 수렴한다. 대충 생각하면 어떤 $\Delta x$에 대해서도 $f(x_0)$ = $(f_r + f_l)/2$를 만족해서 $\Delta x \to 0$인 경우에도 $f(x_0)$는 고정된다.

[참고문헌]
[1] W. O. Amrein, A. M. Hinz, D. B. Pearson, SturmLiouville Theory: Past and Present, Birkhäuser Basel, 2005.
[2] R. D. Costin, Completeness of the Eigenfunctions, SturmLiouville Theory, 2010. (방문일 2011-12-05)

[다음 읽을거리]
1. 고유치가 복소수인 스튀름–리우빌 이론

댓글 24개 :

  1. 오호 이런식으로 증명하는 거였군요. 궁금하긴 했었는데, 게을러서 안찾아봤는데...ㅋ

    우연히 Dirac Delta function 검색하다가 블로그를 들어왔는데, 정리를 너무 잘해놓으셔서 이것저것 둘러보면서 도움 많이 받고 갑니다. 감사합니다.

    답글삭제
  2. 해석학의 극적인 적용이 고유함수의 완비성입니다. 특히 스투름-리우빌 정리 부분을 완벽히 이해하면 물리학에 출현하는 미분방정식과 무한급수의 두려움이 없어질겁니다.

    답글삭제
  3. 한창 미분방정식과 씨름하고 있는 물리학과 학부생입니다. 웬만한 책에선 찾기 힘든 내용들이 일목요연하게 정리되어있어서 너무 좋네요. 스투름-리우빌 Theorem 외에도 많은 글에서 여러개 배워갑니다^^

    답글삭제
    답글
    1. 방문 감사합니다, 익명님. 열심히 물리학 공부합시다. ^^

      삭제
  4. 15번 부터는 다음에 시간이 나면 봐야겠네요. 감사합니다!
    라플라스가 푸리에 변환의 일반화된 형태라고 하더니, 그것도 스트룸 리우빌 이론 안에 들어가네요..
    소름이;;

    답글삭제
    답글
    1. 실제로 적분변환에서 커널 함수들이 여기서 나온 것 같은데, 나중에 찾아봐야 겠네요.

      삭제
  5. 아... 고유함수의 완비성... 궁금했었지만 엄밀히 증명할 생각은 안해보고 있었는데...! 아직은 어렵군요... 천천히 공부해보렵니다 감사합니다!

    답글삭제
  6. 식 (2)에서 r(x)는 왜 들어가있는지 궁금합니다.

    답글삭제
    답글
    1. 본문 초반에 제시한 "스투름-리우빌 이론"부터 시작하세요, Donghoon님. ^^

      삭제
  7. 안녕하세요 전파거북이님! (11)번 식을 읽다가 문득 궁금하여 여쭙니다.

    스투룸의 비교 정리에 의해 고유치 값들 간의 서열화를 이룰 수 있고, 레일리 몫은 그 상세한 값을 계산할 수 있기에, M+1 번째 고유치를 추정하는 방법을 논하는 것으로 이해했습니다.

    그렇다면 그 값은 M+1번째 레일리 몫 이 될 것이고, phi_(M+1) 대신 g_M이 대입된 레일리 몫 꼴과의 비교를 행하며 g_M은 M+1번째 phi성분부터 충분히 큰 순번의 phi가 합쳐진 값이 될거구요.

    그런데 스투름의 비교 정리와 레일리 몫에서는 특정한 값을 가진 고유값과 서로 독립한 대응되는 고유함수에 대해서 서술해 왔는데, 갑자기 여러 독립한 성분을 합친 g라는 함수를 레일리 몫의 꼴에서 설명하고 있어서 퍽 난감합니다. 이 부분에 대해서 추가적으로 설명을 부탁드려도 될까요?

    감사합니다! ^~^

    답글삭제
    답글
    1. 그런 부분을 이해시키기 위해 식 (9), (10)을 먼저 쓴 것입니다. 레일리 몫을 사용하면 고유치가 나옵니다. 하지만 함수 $g$는 특정 고유 함수가 제거되었기 때문에 해당 고유치는 나올 수 없습니다. 또한 식 (6)이 성립하기 때문에 최소 고유치가 존재해야 하고, 식 (11) 경우는 그 최소값이 $\lambda_{M+1}$이 됩니다.

      삭제
  8. 전파거북이님 정말 감사합니다.
    질문이 있습니다.
    고유치와 고유함수는 공학분야에서 어떤 의미를 가지는지요?

    저는 기계공학 열전달에 관심이 있습니다.

    열전도 방정식을 풀다보면 변수분리법과 선형성을 이용하여 엄밀해를 구하곤 하는데,
    여기서 고유치(eigenvalue)가 나옵니다.
    이게 물리적으로 어떤 의미가 있는지 의문입니다.

    살펴보면 전자쪽이시지만, 거북이님의 식견을 보면 좀 알수 있지 않을까해서 여쭤봅니다.

    좋은 하루 되세요~

    답글삭제
    답글
    1. ssamton님, 열 방정식은 저도 잘 몰라요. ^^

      수학적으로 고유치와 고유 함수는 서로 대응됩니다. 간단히 보면, 복잡한 고유 함수(미분 방정식의 해)를 단 하나의 숫자로 표현한 것이 고유치입니다.

      삭제
    2. 제 나름의 해석을 적어보도록 할게요.
      고유치와 고유함수의 다른 말은 특성치와 특성함수입니다.
      고유하다, 특성을 가지고 있다라는 말을 잘 살펴보면
      eigenvalue와 eigenfunction을 보면 그 선형변환의 특징을 알 수 있다는 뜻을 내포하고 있음을 알 수 있습니다.

      따라서 물리적으로 보았을때는 정말 다양한 의미를 내포합니다.
      미분방정식에서는 특성치를 이용해서 해를 구해내기도 하는데,
      이 미분방정식을 쓰는 분야에 있어서 고유값만 가지고 다양한 "특성"을 유추할 수 있습니다.
      제어공학에서는 LTI시스템에서의 전달함수의 pole을 고유값이 의미하는데, 전달함수의 pole에 따라서 안정성여부, 어떻게 과도응답을 지나서 정상상태까지 가느냐 등 모양을 유추할 수 있는 수가 됩니다.
      신호및시스템에서는 e^st 와 같은 신호를 집어넣으면 LTI 시스템하에서는 eigenvalue만 곱해져 나와서 분석이 용이하지요.
      물리학적 직관으로 보았을때는 gain으로 해석하는게 괜찮을듯싶습니다. 선형변환했을때 input한 방향과 같은 방향에서(eigenvector) 얻은 scalar값이 eigenvalue니까, 이걸 이용해서 물리적으로 무궁무진하게 이용할 수 있겠죠.
      복잡한 물리적 상황을 선형적으로 분석하고 싶을때, 또는 선형적으로 근사해서 보고 싶을때 이러한 고유치를 이용하면 간단한(?) 계산으로도 어느정도 포괄적인 특징을 알아낼 수 있습니다.
      일단 저는 이정도로 이해했습니다.
      기계공학의 열전도 방정식을 보니 전자장에서 정전기학에서 전위분포 계산할때 쓰는 라플라스방정식과 유사하네요. 아마도 편미분방정식을 eigenvalue를 구하는 문제로 환원시키는 정도의 역할을 하지 않나싶네요.
      혹은 대충 추론해보면, 얼마나 빠르게 열이 정상상태에 도달하는지를 보여주는 지표라고 볼 수도 있을거같아요. rate of decay같은 이런 개념이 열전도 방정식에도 있는지는 모르겠지만...
      아니면 eigenvalue 절대값이 크면 빠르게 근사항을 얻을 수 있다라는점도 있을거같네요.
      도움이 되었으면 합니다.

      삭제
  9. 스트룸-리우빌 미방을 만족하는 어떤 L2공간의 함수 f는 고유함수를 기저로 하여 표현될 수 있다. 푸리에 급수의 사인함수들은 이 고유함수기저 중 하나를 선택한 것으로 이해해도 될까요?

    답글삭제
    답글
    1. 맞습니다만, 더 정확히 보면 미분 방정식에 따라 고유 함수는 달라집니다. 즉 여러 고유 함수 중에서 사인 함수를 택했다기 보다는 해당 미분 방정식의 해가 사인 함수였기 때문에 사인 함수를 사용한 것입니다.

      삭제
  10. 전파거북이님, 질문이 있습니다.
    (7)에서 왜 경계조건을 만족하는 임의의 함수의 고유치가 람다0보다 크거나 같아야 하나요?
    람다0는 고유함수의 고유치 중 최소값일 뿐 이것이 모든 함수의 고유치 중 최소값이라는 보장은 없지 않나요?

    답글삭제
    답글
    1. 임의 함수 $f$가 스투름–리우빌 미분 방정식을 만족하기 때문입니다.
      최소 고유치 $\lambda_0$보다 작은 고유치가 나오는 $f$가 있다면, 스투름의 진동 정리에 위배되기 때문에 모순이 생깁니다.

      삭제
    2. 임의 함수가 스투름 리우빌 미분 방정식을 만족한다는 말이 무슨 말인가요?

      삭제
    3. 임의 함수가 스투름 리우빌 미분 방정식의 해가 될 수 있다는 뜻인가요?

      삭제
    4. 임의 함수가 스투름 리우빌 미분 방정식을 만족한다는 것이 임의 함수를 고유함수의 선형 결합으로 나타낼 수 있다는 말 그 자체인가요?

      삭제
    5. 함수 $f$의 조건이 스투름–리우빌 미분 방정식을 만족한다는 뜻입니다. 문장을 조금 더 명확히 바꾸어야겠네요.

      삭제
    6. 아직 의문이 풀리지 않아서 여쭙니다.
      식 (6)과 스튀름 진동 정리의 의미는 '고유함수'의 고유치는 최소값이 존재한다는 것인데 고유함수도 아닌 함수 f 가 단지 경계조건을 만족한다는 것만으로는 진동 정리와 연관이 없는 것 아닌가요?

      삭제
    7. 식 (8) 밑에 내용을 더 추가했어요. 계속 고민해서 꼭 이해하시길 바래요 ^^

      삭제

욕설이나 스팸글은 삭제될 수 있습니다. [전파거북이]는 선플운동의 아름다운 인터넷을 지지합니다.