2021년 3월 4일 목요일

행렬 노름과 조건수(Matrix Norm and Condition Number)

[경고] 아래 글을 읽지 않고 "행렬 노름과 조건수"를 보면 바보로 느껴질 수 있습니다.


[그림 1] 3차원에서 정의한 유클리드 거리(출처: wikipedia.org)

벡터(vector) $\bar r$의 크기 $|\bar r|$은 유클리드 거리(Euclidean distance) 혹은 피타고라스 거리(Pythagorean distance)를 이용하여 정의한다. 유클리드 거리는 피타고라스의 정리(Pythagorean theorem)를 [그림 1]처럼 연속적으로 적용해서 만든다.

                  (1)

피타고라스의 정리가 매우 오래 되었기 때문에, 유클리드 거리의 역사도 길다고 오해할지 모른다. 하지만 벡터에는 좌표계(coordinate system)라는 개념이 꼭 필요하므로, 식 (1)과 같은 정의는 데카르트René Descartes(1596–1650)데카르트 좌표계(Cartesian coordinate system)를 발명한 1637년데카르트 41세, 조선 인조 시절(삼전도의 굴욕) 이후에나 등장한다. 우리가 현실에서 보는 좌표계는 2차원 혹은 3차원이라서 식 (1)의 정의만 사용해도 충분하다. 하지만 수학자들의 상상력은 끝이 없어서 식 (1)을 $n$차원 유클리드 거리까지 확장한다.

                  (2)

$n$차원 벡터 공간에 사용되는 식 (2)는 현실 세계의 자유로운 확장이다. 그래서 기하학에 바탕을 둔 유클리드 거리 이외에 다양한 거리 개념을 만들 수 있다. 수학에서는 유클리드 거리를 일반화해서 계량하는 함수를 노름(norm)이라 한다. 이 노름의 치역은 음이 아닌 실수로 정의한다. 노름의 어원은 표준을 뜻하는 라틴어 노르마(norma)이다. 그래서 노름 대신에 규준(規準)이란 용어를 쓰기도 한다. 노름 개념이 벡터에 쓰이면 벡터 노름(vector norm), 행렬까지 확장하면 행렬 노름(matrix norm)이라 한다. 노름은 거리를 일반화하기 때문에 표기법도 유클리드 거리와는 달라진다. 예를 들어, 식 (2)로 정의한 유클리드 거리는 벡터 노름의 일종이라서 다음처럼 유클리드 노름(Euclidean norm)으로 표현할 수 있다.

                  (3)

제곱과 제곱근을 사용한 유클리드 노름을 더 일반화해서 정의한 $p$-노름($p$-norm)도 있다.

                  (4)

차수 $p$가 계속 커지면, 좌표 성분중에서 큰 값이 우세해진다. 그래서 최대 노름(maximum norm) 혹은 무한대 노름(infinity norm)을 다음처럼 정의한다.

                  (5)

$p$-노름의 차수를 $1$로 선택하면 절대값으로 계산하는 택시 노름(taxicab norm)을 얻는다.

                  (6)

사각형으로 도시 계획된 도로를 지나는 택시의 이동 거리와 비슷하다고 해서 식 (6)을 택시 노름이라 부른다. 택시 노름 대신 사각형 도로로 유명한 맨해튼의 거리에 빗대서 맨해튼 노름(Manhattan norm)이라고도 한다.
벡터 노름이 $0$이 되는 벡터는 영 벡터(null vector)라고 한다. 성분이 모두 $0$인 벡터도 영 벡터(zero vector)라고 한다. 여기서 영 벡터의 영어 표현을 보면 다른 용어가 사용됨을 관찰할 수 있다. 우리말 표현은 같더라도 영어로는 벡터 노름이 $0$인 벡터를 영(零) 벡터(zero vector)와 다르게 (無) 벡터(null vector)라고 부른다. 우리가 자주 쓰는 $p$-노름에서는 무 벡터가 영 벡터이기 때문에 용어를 섞어쓰더라도 관계는 없다. 하지만 엄밀하게는 쓸 때는 구별해야 한다. 벡터 노름 정의는 여러 개가 있기 때문에, 벡터 노름을 $0$으로 만드는 무 벡터는 영 벡터만 유일하다고 할 수는 없다. 즉, 영 벡터는 항상 무 벡터이지만, 무 벡터라고 해서 영 벡터라는 보장은 없다.
벡터 노름은 유클리드 거리를 유추해서 손쉽게 정의할 수 있지만, 행렬 노름의 정의에는 수준이 다른 고민이 숨어있다. 왜냐하면 행렬은 행과 열에 모두 원소가 있기 때문에 단순히 벡터 노름을 변형해서 정의하기 어렵다. 그래서 연립 방정식 ${\bf Ax}$ = $\bf b$에 등장하는 행렬의 곱 ${\bf Ax}$를 이용해서 행렬을 벡터로 바꾼 후 행렬 노름을 다음처럼 멋드러지게 정의한다.

                  (7)

여기서 $\bf x$는 임의의 모든 열 벡터(column vector)이다. 열 벡터에 따라 벡터 노름 $\|{\bf Ax}\|$는 달라지므로, 행렬 $\bf A$가 $\|{\bf x}\|$를 기준으로 $\|{\bf Ax}\|$를 최대로 증폭하는 비율로써 행렬 노름 $\|{\bf A}\|$를 정의한다. 또한 행렬 노름은 벡터 노름을 바탕으로 정의하므로, $p$-노름을 강조해서 다음처럼 식 (7)을 다시 쓸 수 있다.

                  (8)

행렬 노름의 개념은 조건수(條件數, condition number) 정의에 필수적이다. 연립 방정식 ${\bf Ax}$ = $\bf b$에서 입력 열 벡터 $\bf b$의 작은 변화 $\Delta {\bf b}$에 대해, 연립 방정식을 풀어서 얻는 출력 열 벡터 $\bf x$의 변화 비율로 조건수를 정의한다. 즉, 조건수는 행렬 연산에 필연적으로 생기는 수치 계산의 오차율을 의미한다. 조건수를 엄밀히 정의하기 위해, 다음과 같은 연립 방정식의 계산 오차 $\Delta {\bf b}$와 $\Delta {\bf x}$를 고려한다.

                  (9)

여기서 불필요하게 생기는 입력 오차 $\Delta {\bf b}$에 의해 해 $\bf x$가 변하는 출력 오차를 $\Delta {\bf x}$라 한다. 식 (9)의 유도 과정을 행렬 노름으로 깔끔하게 표현한다.

                  (10)

식 (10)의 두 부등식을 나누어서 오차를 오차율로 바꾼다.

                  (11)

식 (11)에 등장한 행렬과 역행렬의 행렬 노름 곱을 행렬 $\bf A$의 조건수 ${\rm cond}({\bf A})$라 한다.

                  (12)

여기서 ${\rm cond}({\bf A})$는 $\kappa({\bf A})$로 표기하기도 한다. 식 (11)에 따라 조건수 ${\rm cond}({\bf A})$는 입력 열 벡터의 변화 비율 $\| \Delta {\bf b}\|/\|  {\bf b}\|$이 행렬 $\bf A$에 의해 증폭되어 나타나는 출력 열 벡터의 변화 비율 $\| \Delta {\bf x}\|/\|  {\bf x}\|$에 대한 최대 한계를 규정한다. 다만 조건수를 정의할 때에 사용한 행렬 노름은 $p$-노름을 사용하므로, 행렬 $\bf A$가 동일하더라도 차수 $p$에 따라 조건수는 달라질 수 있다.
행렬 노름의 정의에 식 (3)에 나온 유클리드 노름을 선택할 경우는 주로 행렬의 고유치(eigenvalue)와 고유 벡터(eigenvector) 개념을 이용한다. 먼저 대칭 행렬(symmetric matrix)을 만들기 위해 행렬 노름의 제곱을 고려한다.

                  (13)

여기서 $\bf S$ = ${\bf A}^T {\bf A}$는 대칭 행렬이다. 대칭 행렬의 고유치는 실수이고 서로 다른 고유치를 가진 대칭 행렬의 고유 벡터는 서로 직교한다. 이 성질을 이용해서 행렬 곱 $\bf S x$를 직교하는 고유 벡터의 선형 결합(linear combination)으로 다시 표현한다.

                  (14)

여기서 $\alpha_i$는 선형 결합의 계수, $\lambda_i$는 고유치, $\hat {\bf x}_i$는 $\lambda_i$에 대한 단위 고유 벡터(unit eigenvector)[$|\hat {\bf x}_i|$ = $1$]이다. 식 (14)를 식 (13)에 넣어서 행렬 관계를 대수 관계로 바꾼다.

                  (15)

여기서 $r_1^2 + r_2^2 + \cdots + r_n^2$ = $1$이다. 만약 $\lambda_1$이 최대 고유치라면, $r_1^2$ = $1 - r_2^2 - \cdots - r_n^2$을 식 (15)에 대입해서 최대값을 구한다.

                  (16)

따라서 유클리드 노름으로 정의한 행렬 노름의 제곱은 ${\bf A}^T {\bf A}$의 최대 고유치 동일하다.

                  (17)

여기서 $\lambda_{\max}[{\bf A}]$는 행렬 $\bf A$의 최대 고유치이다. 고유치의 최대값은 스펙트럼 반경(spectral radius)이라고도 한다. 만약 $\bf A$가 대칭 행렬이면, 식 (17)은 다음과 같이 더욱 간략화된다.

                  (18)

따라서 대칭 행렬인 경우의 조건수는 고유치의 최대값과 최소값의 비율이다.

                  (19)

여기서 $\lambda_{\min}[{\bf A}]$는 행렬 $\bf A$의 최소 고유치이다. 식 (19)에 따라 조건수의 최소값은 당연히 $1$이다. 고유치의 최소값이 $0$이면, 조건수는 가장 나빠져서 무한대로 발산한다. 즉, 해를 구할 수 없는 조건인 행렬식이 $0$인 경우는 조건수가 무한대로 가서 해의 계산 오차가 무한히 증가한다. 만약 고유치가 음수인 경우는 식 (19)의 결과에 절대값을 적용해서 계산해야 한다.

                  (20)

여기서 $|\lambda|[{\bf A}]$는 $\bf A$에 대한 고유치의 절대값, $\max$와 $\min$은 각각 고유치 절대값의 최대값과 최소값을 뜻한다.
행렬 $\bf A$가 대칭이 아닌 경우는 특이값 분해(singular value decomposition, SVD)를 이용한다. 유클리드 노름의 최대값은 특이값(singular value)이므로, 최대와 최소 특이값을 구해서 행렬 노름과 조건수를 명확히 정의한다.

                  (21)

                  (22)

여기서 $\sigma_{\max}[{\bf A}]$와 $\sigma_{\min}[{\bf A}]$는 각각 행렬 $\bf A$의 최대 및 최소 특이값이다.

[참고문헌]
[1] G. Strang, Linear Algebra and its Applications, 4th ed., Brooks/Cole, 2006.

[다음 읽을거리]

2021년 1월 17일 일요일

등각 사상(等角寫像, Conformal Mapping)

[경고] 아래 글을 읽지 않고 "등각 사상"을 보면 바보로 느껴질 수 있습니다.


[그림 1] 등각 사상의 예시(출처: wikipedia.org)

복소 함수(complex function)가 가진 놀라운 성질 중의 하나는 등각 사상(等角寫像, conformal mapping)이다. 등각 사상은 정의역에 있는 곡선의 국소적인 각도를 보존하면서 치역으로 사상한다. 즉, 등각 사상에서는 곡선의 국소적 각도 분포가 정의역과 치역에서 서로 같다. 다만 정의역에서 치역으로 갈 때, 곡선의 국소적 길이는 변할 수 있다. [그림 1]은 왼쪽에 있는 직선이 오른쪽에 있는 원으로 변환되는 등각 사상을 보여준다. 곡선의 모양이 많이 바뀌지만, 두 곡선이 만나는 각도는 왼쪽과 오른쪽이 90˚로 모두 동일하다. 그래서 [그림 1]은 등각 사상의 실제적인 특성을 잘 보여준다.
등각 사상의 이해에는 해석 함수(解析函數, analytic function)정칙 함수(正則函數, holomorphic function)의 개념이 필요하다. 해석적인 복소 함수(complex analytic function)필연적으로 정칙 함수가 되기 때문에, 어느 방향으로 미분하더라도 복소 함수의 미분은 동일하다. 그래서 $z$ = $z_0$ 근방에서 $z$와 $f(z)$는 다음과 같이 서로 연결되어 있다.

                  (1)

만약 $f'(z_0)$는 $0$이 아니라면, $z - z_0$의 각도가 변하는 특성은 극형식(polar form)에 의해 다음처럼 $f(z) - f(z_0)$의 각도 변화에 정확히 연결된다.

                  (2)

여기서 $z - z_0$ = $|z - z_0|e^{i \phi}$, $f(z) - f(z_0)$ = $|f(z) - f(z_0)|e^{i \varphi}$, $f'(z_0)$ = $|f'(z_0)| e^{i \varphi_0}$이다. 이러한 결과로 인해 해석적인 복소 함수는 국소적인 각도가 보존되는 등각 사상이 된다. 또한 $f'(z_0)$ = $0$이면, $z - z_0$에 관계없이 식 (1)이 성립한다. 그래서 임계점(臨界點, critical point)이라 부르는 $f'(z_0)$ = $0$인 조건에서는 $z - z_0$와 $f(z) - f(z_0)$는 서로 상관 관계가 없어진다. 즉, 임계점에서는 식 (2)와 같은 등각 사상이 성립하지 않는다.
등각 사상인 $f(z)$의 기하학적 특성을 단위 접선 벡터(unit tangential vector)의 사상(寫像, mapping) 관점에서 새롭게 고찰할 수도 있다. 복소 평면 상에 정의한 곡선 $z$의 단위 접선 벡터 $\hat t$은 다음과 같은 미분으로 표현된다.

                  (3)

마찬가지로 곡선 $z$의 등각 사상인 곡선 $f(z)$의 단위 접선 벡터를 $\hat \tau$라 한다.

                  (4)

그러면 임계점이 아닌 위치에서 단위 법선 벡터간의 편각 관계는 다음과 같다.

                  (5)

식 (5)에 의해 $\hat \tau$와 $\hat t$의 변화 특성은 $f'(z)$의 편각만큼만 차이난다. 식 (5)의 결과는 식 (2)와 동일하기 때문에, 등각 사상을 단위 법선 벡터의 변화로 간주할 수도 있다. 
등각 사상은 라플라스 방정식(Laplace's equation)을 푸는 새로운 해법이기도 하다. 등각 사상은 당연히 해석적인 복소 함수이므로, 코쉬–리만 방정식(Cauchy–Riemann equation)이 성립한다. 복소 함수 $f(z)$[= $u(x, y) + i v(x, y)$]의 실수부 $u(x, y)$와 허수부 $v(x, y)$를 따로 편미분하면 다음과 같은 $u(x, y)$에 대한 2차원 라플라스 방정식을 만들 수 있다.

                        (6)

                        (7)

허수부 $v(x, y)$를 기준으로 식 (7)과 동일한 방법을 적용하면 $v(x, y)$에 대한 2차원 라플라스 방정식도 얻는다.

                        (8)

또한 코쉬–리만 방정식에 의해 $u(x, y)$와 $v(x, y)$의 구배(gradient)는 항상 서로 직교하는 성질이 있다.

                        (9)

함수 $u(x, y)$와 $v(x, y)$의 구배 크기는 $|\bar \nabla u|$ = $|\bar \nabla v|$ = $|f'(z)|$인 관계도 성립한다. 따라서 2차원 라플라스 방정식을 풀 때는 보통 등각 사상의 개념으로 경계 조건을 다룬다. 그러면 굉장히 쉽게 원하는 해를 찾을 수 있다.
해석적인 복소 함수는 자유롭게 구성할 수 있기 때문에, 복소 함수론에 나오는 등각 사상은 무한개가 존재한다. 여러 종류의 등각 사상 중에서 간단하면서도 정말 중요한 예시는 [그림 1]에 나오는 뫼비우스 변환(Möbius transformation) 혹은 쌍일차 변환(雙一次變換, bilinear transform)이다. [그림 1]과 같은 뫼비우스 변환[= $(z-1)/(z+1)$]은 무한 반평면을 작은 원 내부로 사상한다. 따라서 뫼비우스 변환은 상상하기 힘든 무한대 범위를 유한한 원 내부로 바꾸어준다. 간단하지만 강력한 뫼비우스 변환의 일반형은 다음과 같다.

                  (10)

뫼비우스 변환이 유리 함수 형태로 남으려면 약분이 되어서는 안된다. 다음과 같은 과정에 따라, 뫼비우스 변환이 존재하지 않는 조건은 $ad - bc$ = $0$이 된다.

                  (11)

여기서 $p$는 복소수인 상수이다. 거꾸로 뫼비우스 변환이 성립하는 조건은 $ad - bc$ $\ne$ $0$이다. 이 조건은 직선 $az + b$와 $cz + d$가 평행이 되지 않는 조건과 등가이다.

[그림 2] 슈바르츠–크리스토펠 사상의 예시(출처: wikipedia.org)

등각 사상의 또 다른 재미난 결과는 [그림 2]에 예시로 나타낸 슈바르츠–크리스토펠 사상(Schwarz–Christoffel mapping)이다[4]. 다음과 같은 슈바르츠–크리스토펠 사상은 허수부가 $0$보다 항상 큰 상반평면(上半平面, upper half-plane) 전체를 볼록 다각형의 내부로 변환한다.

[그림 3] 슈바르츠–크리스토펠 사상과 영역 변환

[슈바르츠–크리스토펠 사상]

                  (12)

여기서 $C, K$는 상수, $f(0)$ = $C$, $a < b < c < \cdots$는 정의역 $z$의 실수축에 있는 점, 실수인 $\alpha, \beta, \gamma, \cdots$는 치역 $f(z)$에 만들어진 볼록 다각형의 끼인각(included angle)이다. 슈바르츠–크리스토펠 사상에서 실수 점 $a, b, c, \cdots$는 볼록 다각형의 꼭지점으로 사상되며, 이 꼭지점에 있는 각도는 $\alpha, \beta, \gamma, \cdots$가 된다.

[증명]
식 (12)의 증명을 간략화하기 위해서 [그림 3]의 왼쪽처럼 실수축 위에 있는 3개의 점만 고려한다. 그러면 다음 복소 함수를 정의할 수 있다.

                  (13)

식 (13)을 이용해 복소 함수 $f'(\zeta)$의 편각을 식 (2)처럼 기술한다.

                  (14)

실수축 위에 있는 $\zeta$가 $a$보다 작으면, $f'(\zeta)$의 편각은 항상 다음과 같은 상수가 된다.

                  (15)

여기서 ${\rm arg}(\zeta - a)$ = ${\rm arg}(\zeta - b)$ = ${\rm arg}(\zeta - c)$ = $\pi$이다. 식 (13)을 실수축 위에서 움직이는 $\zeta$에 대해 적분해서 복소 함수 $f(z)$의 변화도 관찰한다.

                  (16)

여기서 $z_0 < z < a$, ${\rm arg}[f'(\zeta)]$ = $\varphi_0$이다. 식 (16)의 마지막식에 나타난 적분은 실수이므로, $f(z)$의 편각은 변하지 않는다. 즉, 실수축 위에서 변하는 $a$보다 작은 $z$에 대해, [그림 3]의 오른쪽처럼 $f(z)$는 복소 평면 상에서 직선처럼 움직인다. 실수 $\zeta$가 $a$를 지나서 $a < \zeta < b$라면, 식 (15)의 편각은 다음처럼 $\pi - \alpha$만큼 증가한다.

                  (17)

여기서 ${\rm arg}(\zeta - a)$ = $0$이다. 따라서 실수축을 따라 변하는 $z$가 $a$를 지나면, 직선 $f(z)$의 편각은 [그림 3]의 오른쪽처럼 $\pi - \alpha$만큼 커진다. 이러한 기하학적 관계로 인해, $\alpha$는 편각이 식 (15)와 (17)인 두 직선 사이의 끼인각이다. 혹은 등각 사상에 대한 단위 법선 벡터의 관계인 식 (5)를 이용할 수도 있다. 입력 변수 $z$는 실수축에만 있으므로, 단위 법선 벡터 $\hat t$는 항상 $1$이며 편각은 $0$이다. 그래서 식 (5)에 의해 $f(z)$의 단위 법선 벡터인 $\hat \tau$의 편각은 ${\rm arg}[f'(z)]$와 같다. 비슷한 논증을 $z$ = $b$와 $c$에 대해서도 실행하면, 실수축에서 변하는 $z$의 사상 $f(z)$의 궤적은 사각형을 이룬다. 복소 평면에 형성된 사각형의 세 꼭지점은 $f(a)$, $f(b)$, $f(c)$이다. 나머지 한 꼭지점은 $\lim_{z \to \pm \infty}f(z)$이다. 또한 사각형은 볼록 다각형이므로 항상 $1 - \alpha / \pi > 0$, $1 - \beta / \pi > 0$, $1 - \gamma / \pi > 0$, $\alpha + \beta + \gamma$ $<$ $2 \pi$가 성립한다.
실수에서 복소수로 $z$를 확장하려면, 식 (12)의 분모에 있는 멱함수(power function)를 해석적으로 만들기 위한 가지 자름(branch cut)이 필요하다. 예를 들어, $z$ = $a$ 근방에서 멱함수는 다음처럼 표현된다.

                  (17)

여기서 $\phi$ = ${\rm arg}(\zeta - a)$이다. 식 (15)와 (17)을 유도할 때, $\phi$는 $0$에서 $\phi$까지 변한다고 자연스럽게 가정한다. 그러면 $z$의 편각은 $0$에서 $\pi$까지 연속적으로 변해야 한다. 이를 위해 $z$ = $a$ 근방의 멱함수가 해석적이기 위한 가지 자름을 [그림 4]처럼 정의한다. 여기서 $-\pi/2 < \phi < 3 \pi/2$를 만족한다.

[그림 4] 점 $z$ = $a$의 근방을 표현하기 위한 가지 자름

[그림 4]와 같은 가지 자름은 $z$ = $b$와 $c$에도 나타나므로, [그림 3]의 왼쪽에서 해석적인 영역은 당연히 $\Im[z] > 0$이다. 또한 $|z|$이 매우 커지는 영역에서 $f(z)$의 수렴을 확인한다. 먼저 $a, b, c$의 절대값보다 매우 큰 값을 $R$이라 한다. 그러면 $|z| > R$에 대해 다음 부등식이 성립한다.

                  (18)

여기서 $|a| \ll R$이다. 다른 점 $b, c$에 대해서도 식 (18)이 성립하므로, $f'(z)$의 크기는 다음과 같이 제한된다.

                  (19)

여기서 $M$은 적당히 큰 양의 실수이다. 다음 단계로 식 (19)를 이용해 식 (12)의 크기를 구한다.

                  (20)

여기서 $\alpha, \beta, \gamma$는 볼록 다각형의 끼인각이라서 $\alpha + \beta + \gamma$ $<$ $2 \pi$이다. 따라서 $R$이 계속 커지더라도 $f(z)$는 잘 수렴한다. 이의 결과로써 식 (12)는 $\Im[z] > 0$인 영역에서 해석적으로 잘 정의된다.
지금까지 실수축 위의 3개의 점만 고려했지만, [그림 3]처럼 실수인 점이 3개를 초과하더라도 위와 동일한 증명 방식을 이용해 실수축 위의 점이 볼록 다각형으로 사상됨을 쉽게 증명할 수 있다.
______________________________

식 (12)를 이용해서 [그림 2]를 위한 슈바르츠–크리스토펠 사상의 관계식을 쉽게 유도할 수 있다. 실수축 위의 점은 2개이며 $a$ = $-1$, $b$ = $1$이라 한다. 또한 끼인각 $\alpha, \beta$는 서로 같으므로 $\alpha$ = $\beta$ = $\pi/2$가 된다. 이 결과를 식 (12)에 대입해서 정리한다.

                  (21)

만약 $f(1)$ = $0$, $f(-1)$ = $\pi i$라면, $K$ = $1$, $C$ = $0$이 되어야 한다. 즉, [그림 2]와 같은 등각 사상은 매우 간단하게 $f(z)$ = $\cosh^{-1} z$로 표현된다.

[참고문헌]
[1] J. W. Brown and R. V. Churchill, Complex Variables and Applications, 8th ed., New York, USA: McGraw-Hill, 2004.
[2] C. K. Koc and P. F. Ordung, "Schwarz-Christoffel transformation for the simulation of two-dimensional capacitance," IEEE Trans. Comput.-Aided Design Integr. Circuits Syst., vol. 8, no. 9, pp. 1025–1027, Sept. 1989.
[3] W. P. Calixto, B. Alvarenga, J. C. da Mota, L. d. C. Brito, M. Wu, A. J. Alves, L. M. Neto, and C. F. R. L. Antunes, "Electromagnetic problems solving by  conformal mapping: a mathematical operator for optimization," Math. Probl. Eng., 2010, art. ID 742039.
[4] H. A. Schwarz, Ueber einige Abbildungsaufgaben (About some mapping problems), Gesammelte Mathematische Abhandlungen (Collected Mathematical Treatises), vol. 2, Berlin: Springer, 1890, pp. 65–83. (방문일 2022-11-06)
[5] P. K. Kythe, Handbook of Conformal Mappings and Applications, New York: CRC Press, 2019.

[다음 읽을거리]

2021년 1월 16일 토요일

편각 원리(偏角原理, Argument Principle)

[경고] 아래 글을 읽지 않고 "편각 원리"를 보면 바보로 느껴질 수 있습니다.


[그림 1] 복소 함수의 영점[파랑]과 극점[빨강] 표현(출처: wikipedia.org)

복소 함수(complex function)편각 원리(偏角原理, argument principle)는 [그림 1]처럼 닫힌 경로 내부에 존재하는 유리형 함수(meromorphic function)의 영점(zero)극점(pole)을 판별할 때 유용하다. 편각 원리는 구체적으로 코쉬의 편각 원리(Cauchy's argument principle)라고도 한다. 로그 함수(logarithmic function)의 미분에 바탕을 두고 편각 원리를 표현하면 다음과 같다.

[편각 원리]

                  (1)

여기서 $f'(z)$는 $f(z)$의 미분인 $df(z)/dz$, $c$는 반시계 방향으로 도는 닫힌 경로, $Z$와 $P$는 각각 닫힌 경로 $c$ 안에 존재하는 영점과 극점 차수(order)의 총합이다.

[증명]
복소 함수 $f(z)$의 제$m$번째 영점 $z_m$에 대해 $f(z)$ = $(z-z_m)^{Z_m} g(z)$를 정의한다. 여기서 $Z_m$은 영점의 차수, $g(z_m)$ $\ne$ $0$이다. 이 경우 식 (1)의 피적분 함수처럼 로그 함수 $\log f(z)$의 미분을 계산한다.

                  (2)

점 $z$ = $z_m$이 중심인 닫힌 경로 $c_m$에 대해 식 (2)를 복소 적분한 후 유수 정리(residue theorem)를 적용한다.

                  (3)

여기서 $g'(z)/g(z)$는 $z$ = $z_m$에서 해석적이어서 유수가 없다. 모든 영점에 대해 식 (3)을 연속적으로 적용해서 정리한다.

                  (4)

여기서 $M$은 $c$ 안에 있는 영점의 개수, $Z$는 영점 차수의 총합이다. 식 (2)와 비슷하게 제$n$번째 극점 $z$ = $p_n$ 근방에서 $f(z)$ = $h(z)/(z - p_n)^{P_n}$이라 둔다. 여기서 영점처럼 $h(p_n)$ $\ne$ $0$이다. 그러면 극점에 대해서도 다음 관계가 성립한다.

                  (5)

따라서 모든 극점에 대해 극점 차수의 총합 $P$를 다음처럼 구한다.

                  (6)

여기서 $N$은 $c$ 내부에 존재하는 극점의 개수, $d_n$은 제$n$번째 극점 $z$ = $p_n$ 주변을 도는 닫힌 경로이다. 최종적으로 식 (4)와 (5)를 합쳐서 식 (1)을 증명한다.
______________________________

닫힌 경로 $c$ 내부에 단순 영점(simple zero)[차수가 $1$인 $z - z_m$ 형태의 영점]과 단순 극점(simple pole)[차수가 $1$인 $1/(z - z_n)$ 형태의 극점]만 있다면, $Z$와 $P$는 각각 영점과 극점의 개수인 $M$과 $N$이 된다. 식 (1)이 편각 원리인 이유는 로그 함수의 성질에 의해 $f(z)$의 편각(argument)만 적분에 남기 때문이다.

                  (7)

여기서 $|f(z)|$의 적분은 한 바퀴를 돌 경우 크기가 같아서 항상 $0$이 된다. 식 (1)에 있는 편각의 원리를 조금 더 일반화해서 해석 함수 $g(z)$의 복소 적분을 급수 형태로 쉽게 전환할 수 있다.

                  (8)

식 (8)을 이용하면 복소 적분에 바탕을 두고 무한 급수를 적분으로 바꾸는 아벨–플라나 공식(Abel–Plana formula)을 증명할 수 있다[1].

[그림 2] 아벨–플라나 공식을 위한 적분 경로(출처: wikipedia.org)

[아벨–플라나 공식]

                  (9)

여기서 $f(z)$는 경로 $c$와 $c$의 내부에서 해석적이며, 양의 실수인 적절한 $M$과 $\epsilon$에 대해 $\lim_{R \to \infty} f(z)$ $\sim$ $M/|z|^{1+\epsilon}$이 성립한다.

[증명]
식 (8)에 필요한 닫힌 적분 경로 $c$를 [그림 2]와 같이 선택해서 복소 적분을 정의한다.

                  (10)

여기서 $\sin (\pi z)$는 $z$ = $0, 1, \cdots$에서 단순 영점(simple zero)을 가진다. 식 (10)에 나온 코탄젠트 함수는 적분 경로에 따라 다르게 표현한다.

                  (11)

식 (11)을 식 (10)에 대입해서 각 경로에 대해 복소 적분을 한다.

                  (12)

                  (13)

여기서 $R \to \infty$, $r$은 임의로 작은 양의 실수, $c_1$과 $c_5$ 상의 경로 적분은 조르당의 보조 정리(Jordan's lemma)에 의해 $0$이다. 양의 실수 $r$을 $0$으로 보내면서 경로 $c_3$에 대한 복소 적분도 한다.

                  (14)

식 (14)와 비슷하게 식 (12), (13)에 있는 $r$도 $0$으로 가는 극한을 취한다. 마지막으로 식 (12)–(14)를 모두 합치면 식 (9)가 증명된다.
______________________________

아벨–플라나 공식의 기본 개념은 오일러–매클로린 공식(Euler–Maclaurin formula)과 동일하다. 다만 아벨–플라나 공식은 복소 함수에 대한 복소 적분이 바탕이고, 오일러–매클로린 공식은 기초적인 실수 함수를 사용한다.

[참고문헌]
[1] N. H. Abel, "Opløsning af et Par Opgaver ved Hjælp af bestemte Integraler (Solving a few tasks using specific integrals)," Magazin for Naturvidenskaberne (Magazine for the Natural Sciences), vol. 2, pp. 55–68, 1823. (방문일 2021-01-17)