2024년 2월 4일 일요일

클레로의 미분 방정식(Clairaut's Differential Equation)

[경고] 아래 글을 읽지 않고 "클레로의 미분 방정식"을 보면 바보로 느껴질 수 있습니다.


클레로의 미분 방정식(Clairaut's differential equation)은 미분 대수 방정식(微分代數方程式, differential algebraic equation) $F(dy/dx, y, x)$ = $0$을 변형해서 $y$를 기준으로 정리한 미분 방정식이다.

                        (1)

여기서 $p$ = $dy/dx$이다. 식 (1)로 정의한 미분 방정식의 최초 제안자는 클레로Alexis Clairaut(1713–1765)이다. 1734년클레로 30세, 조선 영조 시절에 클레로는 직선의 포락선(包絡線, envelope)을 연구하는 과정에서 이 방정식을 발견했다. 포락선은 봉투라는 뜻에도 있듯이, 우리가 고려하는 곡선 집단에 모두 접하는 혹은 포장하는 곡선이다. 추가적으로 미분 대수 방정식을 $dy/dx$에 대해 정리한 $dy/dx$ = $f(x, y)$는 잘 알려진 1계 상미분 방정식(the first order ordinary differential equation)이다.
첫눈에 어려워 보이는 클레로의 미분 방정식의 해는 의외로 간단하다. 식 (1)을 $x$에 대해 미분만 하면 답이 얻어진다.

                        (2)

여기서 $f'(p)$ = $df(p)/dp$이다. 만약 $dp/dx$ = $0$이라면, $p$ = $k$가 되며 식 (1)에 $p$ 대신 상수 $k$를 넣어서 1차 함수를 만든다.

                          (3)

여기서 $k$는 기울기, $y$절편[$x$ = $0$에서 $y$값]은 $f(k)$이다. 기울기 $k$는 어떤 값이든 될 수 있어서 식 (1)은 이 미분 방정식의 일반해(general solution)라 부른다. 식 (2)가 표현하는 또 다른 해도 있다.

                        (4a)

주어진 $p$에 대해 점 $(x, y)$가 하나로 결정되므로, 기울기 매개변수 $t$를 도입해 궤적을 그리면 새로운 곡선이 된다.

                          (4b)

식 (4b)는 식 (3)을 만족하고 $(x, y)$에서 기울기는 $t$ = $k$이다. 따라서 식 (3)은 식 (4b)의 접선이며, 식 (4b)는 접선 방정식인 식 (3)의 윤곽을 나타내는 포락선이다. 이런 접선과 포락선의 관계를 생성하는 해는 특이해(singular solution)가 된다. 그래서 $x$ = $-f'(p)$는 이 미분 방정식의 특이해이다.

[그림 1] $f(p)$ = $p^2$인 클레로의 미분 방정식에 대한 여러 해(출처: wikipedia.org)

[그림 1]은 식 (1)에서 $f(p)$ = $p^2$을 만족하는 모든 해를 가시적으로 보여준다. 함수 $f(p)$는 직선인 일반해의 $y$절편이므로, [그림 1]에 나온 직선의 $y$절편은 항상 0보다 크거나 같다. 이 직선이 모두 모여서 만드는 파란색 곡선은 직선의 포락선이며 식 (4b)로 그린다. 클레로의 미분 방정식에서 나온 특이해는 기하 광학(geometrical optics)의 맹점인 소작 곡선(燒灼曲線, caustic curve)에 해당한다. 즉, 높은 주파수에서 빛의 반사와 굴절을 다루는 기하 광학에서 광선(ray)은 일반해인 직선이며, 이 광선이 모여 집중되면서 문제를 일으키는 소작 곡선은 특이해로 볼 수 있다.

[다음 읽을거리]

2024년 2월 3일 토요일

베르누이 미분 방정식(Bernoulli Differential Equation)

[경고] 아래 글을 읽지 않고 "베르누이 미분 방정식"을 보면 바보로 느껴질 수 있습니다.


1계(階) 상미분 방정식(the first order ordinary differential equation, the first order ODE) 중에서 해법이 알려진 드문 경우가 베르누이 미분 방정식(Bernoulli differential equation)이다. 미적분학 초기 개척자인 야곱 베르누이Jacob Bernoulli(1655–1705)가 1695년베르누이 40세, 조선 숙종 시절에 발견한 베르누이 미분 방정식은 내부에 $y^n$이란 비선형성이 있더라도 정확하게 풀린다.

                          (1)

여기서 $n \ne 0$ 및 $n \ne 1$이다. 만약 $n$ = $0$이나 $1$이 되면, 표준 해법이 있는 통상적인 1계 선형 상미분 방정식(the first order linear ODE)에 속해서 굳이 베르누이 미분 방정식 범주에 넣지 않는다. 식 (1)에 정의한 베르누이 미분 방정식을 기준으로 다양한 변형을 가해서 리카티 미분 방정식(Riccati differential equation)이나 로지스틱 혹은 산법 미분 방정식(logistic differential equation) 등에 이를 수 있다.
식 (1)을 풀기 위해 먼저 $u$ = $y^{1-n}$으로 변수 치환하고 미분을 $du$ = $(1-n)y^{-n}dy$, $dy$ = $y^n \mathbin{/}(1-u) \cdot du$로 바꾼다. 그러면 식 (1)은 $u$에 대한 1계 선형 상미분 방정식으로 변형되어서 답을 정확히 구할 수 있다.

                  (2)

식 (2)를 다시 $y$로 기술하면, $y(x)$ = $u^{1 /(1-n)}$ = $1 \mathbin{/} \sqrt[n-1]{u(x)}$를 얻는다.


   1. 리카티 미분 방정식(Riccati differential equation)   

리카티Jacopo Riccati(1676–1754)가 1724년리카티 48세, 조선 영조 시절에 제안한 리카티 미분 방정식은 $n$ = $2$인 베르누이 미분 방정식에 비동차 항 $q_0(x)$[$q_0(x) \ne 0$]을 추가한 형태이다. 리카티는 리카티–베셀 함수(Riccati–Bessel function)로도 유명하다.

                          (1.1)

비동차 항 $q_0 (x)$의 추가는 미미해보여 $u$ = $1/y$로 치환해서 식 (2)처럼 해결할 수 있을 것 같다. 하지만 $q_0 (x)$로 인해 식 (2)로 변형할 수 없어서, 리카티의 제안대로 $u$ = $q_2 y$, $u$ = $- v' / v$로 변수를 교체해야 한다.

                          (1.2a)

여기서 $(\cdot)'$는 $x$에 대한 미분, $du/dx$ = $u'$ = $q_2' y + q_2 y'$이다. 변수 치환 $u$ = $- v' / v$로 인해 $du/dx$는 복잡하게 나오지만 새로운 $u^2$ 항이 출현해 미분 방정식이 자연스럽게 풀린다.

                          (1.2b)

식 (1.2b)는 2계 선형 상미분 방정식이라서 해 $v(x)$는 존재하며 유일하다. 이후에 $y(x)$ = $- v' \mathbin{/} (q_2 v)$로 해를 확정한다.


   2. 로지스틱 미분 방정식(logistic differential equation)   

로지스틱 혹은 산법(算法) 미분 방정식은 $n$ = $2$이며 상수 계수를 가진 베르누이 미분 방정식이다.

                          (2.1)

여기서 $r$은 성장 비율(growth ratio), $k$는 운반 용량(carrying capacity)이다. 운반 용량 $k$가 매우 큰 경우, $r > 0$이면 $y$는 증가, $r < 0$ 조건에서는 $y$가 감소한다. 운반 용량 $k$가 크지 않으면, $r, k$ 및 초기값에 따라 결과는 수렴, 발산, 진동할 수 있다. 로지스틱은 풍부한 함의를 가진 고대 그리스어인 로고스(λόγος, 말씀, 사유, 비례)가 어원이다. 로고스에서 파생된 말인 논리(logic)와 비슷하게 로지스틱은 계산법 혹은 사유법을 의미해서 보통 산법으로 번역한다. 다만 병참(logistics)은 로지스틱과 단어가 거의 같지만 어원은 로고스가 아니고 예전 프랑스어인 로게(loge, 막사)에서 유래한다. 식 (2.1)의 미분 방정식에 붙인 로지스틱 혹은 산법은 지수가 나오는 로그 함수(logarithm)와 다르게 결과가 산술적으로 증가한다는 뜻이다. 즉, 로그 함수가 만드는 지수 함수는 지수적으로 매우 빠르게 커지지만 로지스틱 함수(logistic function)는 산술적으로 천천히 늘어난다. 이때 로지스틱 함수는 식 (2.1)의 해를 나타낸다. 로지스틱 함수란 용어는 페르휠스트Pierre François Verhulst(1804–1849)에 의해 1838년페르휠스트 34세, 조선 헌종 시절에 처음 제안되었다.
로지스틱 함수는 주로 시간에 대해 정의되므로, $x$ 대신 시간 변수 $t$로 바꾸고, 함수도 인구수(population)인 $y$ = $p(t)$를 선택한다. 이 조건으로 식 (2)에 넣어서 시간에 대한 인구수 $p(t)$ 변화를 얻는다.

                          (2.2a)

여기서 $r$ = $ak$, $C$는 적분 상수이다. 시간 $t$ = $0$에서 $p(0)$ = $p_0$으로 두고 $C$를 결정해 $p(t)$를 획득한다.

                          (2.2b)

시간이 계속 흐르면 인구수 $p(t)$가 점근하는 수렴값은 $k$이며, 이때 $k$는 현재 환경이 수용할 수 있는 최대 인구수가 된다.

[그림 2.1] 표준 로지스틱 함수의 변화 특성(출처: wikipedia.org)

식 (2.2b)를 바탕으로 로지스틱 함수의 일반형(general form of logistic function) $L(t; m,M,k,t_0)$을 정의한다.

                          (2.3a)

여기서 $m, M$은 각각 로지스틱 함수의 최소값 및 최대값, $k/4$는 최대 기울기 혹은 $t$ = $t_0$에서 기울기이다. 표준 로지스틱 함수(standard logistic function) $\sigma(t)$ = $L(t; 0,1,1,0)$은 $m$ = $0$, $M$ = $1$, $k$ = $1$, $t_0$ = $0$인 경우이다.

                          (2.3b)

로지스틱 함수는 S자 모양으로 변하는 함수의 총칭인 시그모이드(sigmoid)의 대표적 예이다. 시그모이드의 본래 뜻은 시그마(σ, sigma)를 닮은(-oid) 곡선이다.
식 (2.1)의 계수 $r, k$가 $t$에 대한 상수가 아니고 시변(time-varying)인 $r(t), k(t)$일 때는 이산화해서 푸는 방법을 주로 선택한다. 이를 위해 미분을 전방 차분(forward difference)으로 근사화해 정리한다.

                          (2.4)

여기서 $p_n$ = $p(n \Delta t)$, $r_n$ = $r(n \Delta t)$, $k_n$ = $k(n \Delta t)$, $R_n$ = $1 + r_n \Delta t$, $K_n$ = $k_n [1 + 1 \mathbin{/} (r_n \Delta t)]$이다. 우리가 설정하는 $r_n, k_n$ 및 초기값 $p_0$에 따라 $p_n$은 수렴 혹은 발산, 때로는 진동한다. 로지스틱 미분 방정식의 이산형인 식 (2.4)는 사회 과학 분야에서 경제 성장, 주가 변동, 혹은 부동산 시장을 분석할 때 많이 사용된다[1].


[참고문헌]
[1] 김승욱, "로지스틱 방정식을 이용한 부동산경기변동과 부동산정책의 분석," 부동산학보, 제24호, pp. 33–59, 2005년 1월. (방문일 2024-02-03)

2024년 1월 30일 화요일

라그랑주 반전 정리(Lagrange Inversion Theorem)

[경고]아래 글을 읽지 않고 "라그랑주 반전 정리"를 보면 바보로 느껴질 수 있습니다.


[그림 1] 2차 함수의 역함수 예시(출처: wikipedia.org)

역함수(inverse function)를 구할 때는 [그림 1]처럼 $x, y$를 서로 교환해서 $y$에 대해 정리하면 된다. 하지만 $y$ = $f(x)$처럼 $f(x)$를 위한 함수 표현식이 없을 때는 손으로 풀어서 역함수를 구할 수 없고, 역함수를 구하는 표준 방법론을 써야 한다. 함수가 복소 영역에서 해석적인 경우는 라그랑주 반전 정리(Lagrange Inversion Theorem)가 역함수 유도의 특효약이다. 라그랑주 반전 정리는 역함수를 테일러 급수(Taylor series)로 공식화하는 획기적 기법이다. 라그랑주 반전 정리가 존재하기 전에는 역함수를 구할 때에 멱급수의 반전(inversion of power series)[1]이나 테일러 급수를 많이 사용했다. 멱급수 반전은 고등 수학 지식이 필요없다. 인내심만 있으면 누구나 쉽게 유도할 수 있다. 공식을 만들기 위해 함수 $y$ = $f(x)$를 표현하는 멱급수를 정의한다.

                  (1)

여기서 $f(0)$ = $0$이며, 0이 아닐 때는 $y$ 대신 $y-y_0$으로 교체한다. 식 (1)을 참고해서 역함수 $f^{-1}(y)$의 멱급수를 $x$ = $b_1 y + b_2 y^2 + b_3 y^3 + \cdots$로 둔다. 이 역함수를 다시 식 (1)에 넣어서 $y$의 거듭제곱에 대해 정리하고 항별로 비교해 $b_n$을 차례로 구한다.

                  (2a)

                          (2b)

뉴턴Isaac Newton(1643–1727)은 자신이 찾은 로그 함수에 대한 급수 전개를 이용해서 로그의 역함수인 지수 함수(exponential function)를 탐구한 적이 있었다.

                        (3a: 뉴턴–메르카토르 급수)

여기서 무한 급수의 수렴 구간은 $|x| < 1$이다. 식 (3a)의 좌변을 $y$, 우변을 멱급수로 생각해서 식 (2b)를 적용한다.

                  (3b)

식 (3b)의 둘째식은 분명히 지수 함수 $e^y$가 된다. 그래서 로그 함수의 역함수로서 지수 함수를 유도할 수 있다. 다만 로그 함수와 지수 함수의 정확한 개념은 후세 수학자인 오일러Leonhard Euler(1707–1783)에 와서야 확립된다. 멱함수의 반전 공식은 테일러 급수를 써도 증명된다. 식 (1)의 역함수를 $x$ = $f^{-1}(y)$라 두고 테일러 급수의 계수 $b_n$을 $f(x)$의 미분으로부터 얻는다.

                  (4)

여기서 미분 계수는 모두 $x$ = $0$에서 계산한다. 견디는 힘만 있으면 이 과정을 계속 반복해서 원하는 차수까지 $b_n$을 계산할 수 있다. 그러나 너무 귀찮고 반복적이다. 이런 번거로움을 확실해 해결해주는 고급 개념은 유명한 라그랑주 반전 정리이다. 하지만 라그랑주 반전 정리는 테일러 급수를 실수 넘어 복소 영역까지 확장해서 사용한다.

[라그랑주 반전 정리]
복소 함수 $w$ = $f(z)$의 역함수 $g(w)$ = $f^{-1}(w)$는 $z$ = $a$ 근방에서 아래 무한 급수로 표현된다.

                          (5a)

                          (5b)

여기서 $\text{Res}[\cdot]$는 유수(residue), $f(z)$는 $z$ = $a$ 근방에서 해석적(analytic)이다.

[증명]
복소수 $w$가 만드는 복소 평면에 대해 코쉬의 적분 공식(Cauchy's integral formula)을 적용한다.

                  (6a)

여기서 $c$는 $z$의 복소 평면에 정의한 닫힌 경로이다. 식 (6a)에 나온 역함수를 제거하기 위해 복소 함수 관계인 $w$ = $f(z)$, $\eta$ = $f(\zeta)$, $d\eta$ = $f'(\zeta) \, d\zeta$를 대입한다.

                  (6b)

피적분 함수에 위치한 유리 함수를 $z$ = $a$에서 테일러 급수로 전개한다.

                  (6c)

식 (6c)를 식 (6b)에 넣고 무한 급수 기준으로 정리한다.

                  (7a)

식 (7a)에 있는 복소 적분을 부분 적분으로 해결한다.

                  (7b)

여기서 닫힌 경로 $c$로 인해 시작점 $\zeta_1$과 끝점 $\zeta_0$은 동일, $\text{Res}[\cdot]$는 유수(residue)이다. 식 (7b)에서 얻은 유수는 다중극(multiple pole)을 가져서 미분을 통해 계산한다.

                  (7c)

식 (7b)와 (7c)를 식 (7a)에 바꾸어 넣어서 식 (5)의 계수 $g_n$을 결정한다. 식 (7a)에서 $n$ = $0$ 항은 식 (7c)를 쓸 수 없고, 식 (7b)의 적분을 그대로 남겨두고[적분 변수 $\xi$ = $f(\zeta)$에 대한 피적분 함수는 $f^{-1}(\xi) \mathbin{/} [\xi - f(a)]$] 식 (6a)에 도입한 코쉬의 적분 공식을 쓴다. 그러면 최종 결과는 식 (5)처럼 $a$가 된다.
______________________________

람베르트Johann Heinrich Lambert(1728–1777)가 1758년람베르트 30세, 조선 영조 시절에 풀었던 고차 방정식의 해를 라그랑주 반전 정리로 쉽게 유도할 수 있다. 람베르트가 고민한 방정식은 $x^m - x + q$ = $0$이다. 여기서 $m$은 2이상인 자연수, $q$는 상수이다. 역함수 관점에서 보면, $q$ = $f(x)$ = $x - x^m$의 해는 $q$의 역함수인 $x$ = $g(q)$ = $f^{-1}(q)$이다. 이 관계식을 식 (5a)에 적용해서 계산하면 답이 그대로 나온다.

                  (8a)

여기서 $f(0)$ = $0$이다. 변수 $x$의 범위를 $|x| < 1$로 제한한 후 뉴턴의 이항 정리(Newton's binomial theorem)를 이용해 무한 급수를 만든다.

                  (8b)

여기서 $(-n)_k$는 포흐하머 기호(Pochhammer symbol)이다. 다시 식 (8b)를 $n-1$번 미분한다.

                  (8c)

식 (8c)에서 $x$는 0으로 접근하기 때문에, 식 (8c)에서 유일하게 살아남는 항은 $k$ = $(n-1) \mathbin{/}(m-1)$이다. 이 결과를 식 (8a)의 둘째식에 대입한다.

                  (8d)

여기서 $n$은 $(m-1)k + 1$만 유지된다. 그러면 차수가 1보다 큰 고차 방정식의 해는 무한 급수로 정확히 공식화된다.

                          (9)

여기서 $|x| < 1$, $m \ge 2$이다.
람베르트 W 함수(Lambert W function)를 만드는 대칭 방정식 $f(x)$의 역함수를 구할 때는 라그랑주 반전 정리보다 멱급수의 반전이 더 쉽다.

                  (10)

먼저 식 (10)에 정의한 $f(x)$를 $x$ = $1$에서 테일러 급수로 전개한다.

                  (11a)

여기서 $\beta^{(n)}$은 상승 계승(rising factorial)이다. 계수 $a_n$의 분자와 분모를 약분해서 정리한다.

                     (11b)

계수 $a_n$을 식 (2b)에 대입해서 역함수의 계수 $b_n$을 차례로 계산한다.

                     (11c)

이상을 종합해서 식 (10)을 만족하는 $x$를 역함수 $g(c)$ = $f^{-1}(c)$로 구한다.

                          (12)

대부분 상황에 해당하듯이 수학 문제를 풀 때는 도구가 아니라 문제에 집중해야 한다. 그래서 다루는 문제에 따라 라그랑주 반전 정리나 멱급수의 반전을 적절하게 선택한다.

[참고문헌]
[1] H. Chernoff, "A note on the inversion of power series," Mathematical Tables and Other Aids to Computation, vol. 2, no. 20, pp. 331–335, Oct. 1947.

[다음 읽을거리]