2023년 4월 23일 일요일

차분 방정식(差分方程式, Difference Equation)

[경고] 아래 글을 읽지 않고 "차분 방정식"을 보면 바보로 느껴질 수 있습니다.


[그림 1] 함수 $f(x)$의 차분 모습(출처: wikipedia.org)

임의 수열 $f_n$의 차이를 이용해서 $f_n$ = $a f_{n-1} + b f_{n-2} + \cdots$ 등과 같은 형태로 표현한 수식을 차분 방정식(差分方程式, Difference Equation)이라 부른다. 차분 방정식의 대표적인 예는 등비 급수(geometric series)이다.

                  (1)

여기서 $f_0$ = $a_0$은 초기값(initial value), $r$은 공비(common ratio)이다. 식 (1)은 $f_n$을 기준으로 차분이 하나만 있어서 일계 차분 방정식(the first order difference equation)이 된다. 식 (1)을 확장해서 이계 차분 방정식(the second order difference equation)도 쉽게 생성할 수 있다.

                  (2)

여기서 $a, b$는 상수, $f_0, f_1$은 이미 주어진 초기값이다. 식 (2)를 풀기 위해, 식 (1)처럼 $f_n$ = $r^n$이라 가정한다. 그러면 차분 방정식은 통상적인 2차 방정식으로 간략화된다.

                  (3)

식 (2)의 해법인 식 (3)에 나온 오른쪽 식은 차분 방정식을 규정하는 특성 방정식(characteristic equation)이다. 식 (3)에 나온 특성 방정식을 풀어서 나온 공비를 $r_1$, $r_2$라고 하면, 식 (2)의 일반해(general solution)는 미분 방정식처럼 $r_1^n$과 $r_2^n$의 선형 결합으로 구한다.

                  (4)

여기서 $c_1, c_2$는 초기값으로부터 결정한다.
상미분 방정식(ordinary differential equation)처럼 다음과 같은 형태로 기술된 $m$계 차분 방정식($m$th order difference equation)은 해의 존재성과 유일성이 쉽게 증명된다[1].

                  (5)

여기서 ${\bf x}_{n-1}$은 $m$차원을 가진 수열 벡터(vector), $f_0, f_1, \cdots, f_{m-1}$은 이미 알고 있는 초기값, 초기값 벡터는 ${\bf x}_{m-1}$ = $[f_0~f_1~\cdots~f_{m-1}]$이다. 식 (5)에 초기값 벡터 ${\bf x}_{m-1}$부터 차례로 ${\bf x}_{m}, {\bf x}_{m+1}$ 등을 대입하면, 함수값은 $f_{m}$, $f_{m+1}$, $f_{m+2}$ 등으로 유일하게 나온다. 즉, 식 (5)에 ${\bf x}_{m+k-1}$을 넣으면, $f_{m+k}$가 출력되고 그 다음 입력 벡터 ${\bf x}_{m+k}$도 구성된다. 그러면 $n$ = $0, 1, \cdots, m+k$에 대해 $f_0, f_1, \cdots, f_{m+k}$를 출력하는 함수 $f(x)$를 다항 함수 보간(polynomial interpolation) 등으로 만들 수 있다. 여기서 $f_n$ = $f(x)|_{x=n}$은 $0 \le x \le m+k$에서 성립한다. 그 다음 단계로 $x$의 범위를 늘리기 위해, 이전에 생성한 $f(x)$를 식 (5)에 넣어서 $m+k \le x \le m+k+1$에서도 $f(x)$가 정의되게 한다. 여기서 이전 범위에서 변하는 $f(x)$를 ${\bf x}_{n-1}$의 성분에 대입해 연속으로 바꿈으로써 식 (5)의 좌변은 자동적으로 $m+k \le x \le m+k+1$에서 연속이다. 이 과정은 계속 될 수 있으므로, 식 (5)의 차분 방정식은 항상 해를 가진다. 식 (5)와 같은 차분 방정식의 해가 유일하다는 증명도 쉽다. 만약 $n$ = $k$부터 $f(k)$와 함수값이 다른 $g(k)$가 있다고 가정한다. 그러면 식 (5)에 따라 $g(k)$ = $F({\bf x}_{k-1})$ = $f(k)$가 되므로, $g(k)$는 $f(k)$와 다를 수 없어서 모순이다. 해의 존재성과 유일성으로 인해 차분 방정식을 다양한 방식으로 풀 수 있다. 예를 들어, 식 (2)를 풀 때에 Z 변환(Z-transform)을 써도 된다.

                  (6)

차분 방정식은 미분 방정식(differential equation)을 근사적으로 풀 때 매우 유용하다. 수학적 미분을 수치 미분으로 교체해서 미분 방정식을 차분 방정식으로 바꾸어 푸는 방식은 유한 차분법(finite difference method, FDM)이라 부른다. 유한 차분법에서는 해의 수렴성을 꼭 확인해서 풀어야 한다. 왜냐하면 수치 미분으로 인해 반복적인 연산이 들어가므로, 차분 방정식의 해가 미분 방정식의 해로 수렴한다는 확인이 꼭 필요하기 때문이다.

[참고문헌]
[1] S. Tauber, "Existence and uniqueness theorems for solutions of difference equations," Am. Math. Mon., vol. 71, no. 8, pp. 859–862, Oct. 1964.
[2] S. Elaydi, An Introduction to Difference Equations, 3rd ed., New York, USA: Springer, 2005.

[다음 읽을거리]

2023년 4월 16일 일요일

수치 미분(Numerical Differentiation)

[경고] 아래 글을 읽지 않고 "수치 미분"을 보면 바보로 느껴질 수 있습니다.


[그림 1] 여러 가지 차분 방법(출처: wikipedia.org)

미분 공식을 이용해서 어떤 종류의 함수든지 미분을 할 수 있지만, 컴퓨터를 사용해서 미분을 근사할 때는 다음과 같은 차분(差分, difference)을 사용한다.

                  (1)

여기서 $x$의 차분 $h$가 0으로 한없이 접근하면 차분은 미분이 된다. 식 (1)은 현재점 $x$를 기준으로 전방에 위치한 $x+h$의 함수값으로 차분을 구해서 전방 차분(forward difference) $\Delta_f$라 부른다. 이 차분과 $h$의 나눗셈은 차분 몫(difference quotient)이면서 미분의 근사 혹은 수치 미분(numerical differentiation)이 된다. 비슷하게 후방에 있는 $x-h$ 점에서 시작해 구한 차분은 당연히 후방 차분(backward difference) $\Delta_b$가 된다.

                  (2)

혹은 점 $x$의 앞과 뒤에 있는 함수값의 차분을 써서 중앙에서 구한 차분을 만들기도 한다.

                  (3a)

여기서 첫째식의 분자는 중앙 차분(central difference) $\Delta_c$, 둘째식의 분자는 대칭 차분(symmetric difference) $\Delta_s$로 이름 붙인다. 중앙 차분에서 중앙값 $y(x)$는 양쪽 끝값의 평균으로 근사하기도 한다. 이 근사를 쓰지 않으려면 함수 관계로 $y(x)$를 직접 계산하거나 문제 조건에서 $y(x)$를 예측해야 한다.

                  (3b)

반면에 대칭 차분은 $y(x)$를 이미 알고 있어서 식 (3b)가 필요없다. 왜냐하면 간격 $h$를 기준으로 $y(x-h)$, $y(x)$, $y(x+h)$는 이미 주어지기 때문이다.
전방 차분 몫의 오차는 테일러 급수(Taylor series)를 이용해서 쉽게 구할 수 있다.

           (4)

여기서 $y$ = $f(x)$, $h \ll 1$이다. 식 (4)는 일종의 근사라서 마음에 쏙 들지 않는다. 미분에 대한 평균값의 정리(mean value theorem)에서 출발해 식 (4)를 더 엄격하게 표현한다[1].

                  (5a)

                  (5b)

여기서 $x \le \xi \le x+h$이다. 식 (5a)의 결과는 제1차 잉여항(remainder term)을 포함한 테일러 급수(Taylor series)와 동일하다. 비슷한 방식으로 대칭 차분 몫의 오차도 공식화된다.

                  (6)

테일러 급수를 이용한 분석에 따라, $y$ = $f(x)$가 부드럽게 변하는 경우에 중앙이나 대칭 차분 몫이 전방이나 후방 차분 몫보다 훨씬 더 미분값에 가깝다.

[그림 2] 차분 $h$에 대한 수치 미분 오차의 변화(출처: wikipedia.org)

이 시점에서 고민할 부분은 $h$의 선택이다. 미분 정의에 가까우려면 가능한 한 $h$를 작게 택해야 한다. 하지만 현실에서 $h$를 얼마나 작게 할 수 있을까? 여기서 말하는 현실은 컴퓨터로 계산할 때이다. 수치 계산에는 기계 엡실론(machine epsilon)이라는 나름 창의적인 개념이 있다. 0이 아닌 양수인 기계 엡실론 $\varepsilon$은 수치 계산 관점에서 $1+\varepsilon$과 $1$을 다르게 만드는 가장 큰 실수이다. 수학에서는 당연히 $1+\varepsilon$과 $1$이 다르지만, 컴퓨터는 유한한 유효 숫자로 이진수를 만들어서 계산하므로 컴퓨터 구조마다 고유한 기계 엡실론이 존재한다.

[그림 3] 이중 정밀도의 비트 분포(출처: wikipedia.org)

예를 들어, 요즘 사용되는 컴퓨터는 실수 계산을 할 때에 기본적으로 이중 정밀도(double precision)인 64 비트(bit)를 사용한다. 예전에는 단일 정밀도인 32 비트를 주로 사용했다. 이중 정밀도의 비트 분포는 [그림 3]에서 볼 수 있다. C 언어의 실수 자료형(data type)에서 단일 정밀도는 float, 이중 정밀도는 double로 칭한다. [그림 3]에 따라 컴퓨터가 쓰는 이중 정밀도 실수가 가진 유효 숫자(有效數字, significant figure)는 52 비트를 가진다. 이 52 비트는 항상 1.으로 시작하는 이진 소수의 유효 숫자라서 가장 낮은 소수 자리수는 소수점 이하 52번째이다. 그래서 지수(exponent)가 0인 이중 정밀도 실수에서, 1과 가장 가까운 이진수는 1.0000000000000000000000000000000000000000000000000001이 된다. 따라서 이중 정밀도의 기계 엡실론은 $\varepsilon$ = $2^{-52}$ =  2.22044604925031$\cdots \times 10^{-16}$이다. 그러면 $h$ = $\varepsilon$인 경우가 가장 최적의 수치 미분을 얻게 하는가? [그림 2]의 결과를 보면, 우리 예상과는 다르게 $\varepsilon$보다 훨씬 큰 $h$를 선정해야 한다. 수치 미분의 오차를 최대로 줄이는 $h$를 구하기 위해, 컴퓨터로 함수를 계산할 때에 필연적으로 나타나는 반올림 오차(round-off error)를 기계 엡실론 개념으로 근사화한다.

                  (7)

여기서 $\varepsilon_1$ = $\varepsilon_1(x)$, $\varepsilon_2$ = $\varepsilon_2(x, h)$,  $\widetilde{f}(x)$는 $x$에서 계산한 반올림 오차를 반영한 함수값, $f(x)$는 정확한 함수값이다. 식 (7)을 식 (1)에 대입해서 반올림 오차를 가진 수치 미분을 구한다[1].

                  (8)

여기서 $h$는 매우 작아서 $f(x+h)$ $\approx$ $f(x)$이다. 식 (8)을 다시 식 (5b)에 넣어서 수치 미분의 오차 $E (h)$와 최대 오차 $E_{\max}(h)$를 표현한다.

                  (9)

여기서 $|\varepsilon_2 - \varepsilon_1| \le 2 \varepsilon$, $\varepsilon$는 이중 정밀도의 기계 엡실론, $f(\xi)$와 $f^{(2)}(\xi)$는 $x \le \xi \le x+h$에서 거의 상수이면서 0은 아니라고 가정한다. 식 (9)의 둘째식을 미분해서 0이 되는 값이 바로 최적의 $h$인 $h_\text{opt}$이다[1].

                  (10)

함수 $f(x)$마다 $h_\text{opt}$는 다르지만, 편하게 근사하기 위해 보통 $h_\text{opt}$ $\approx$ $2 \sqrt{\varepsilon}$ $\approx$ $3 \times 10^{-8}$으로 생각한다. 이 결과는 [그림 2]에 보이는 $h_\text{opt}$를 잘 설명한다.


   1. 기본(basics)   

[정의]

                  (1.1)

독립 변수 $x$의 차분인 $h$가 같은 간격으로 변하는 경우의 차분을 정의하기 위해 식 (1.1)을 빈번하게 사용한다.

[선형 사상(線型寫像, linear mapping)]

                  (1.2)

모든 종류의 차분에 대해 선형 사상이 항상 성립한다.

[곱의 차분]

                  (1.3a)

                  (1.3b)

여기서 $f_{m+0.5}$ = $(f_m + f_{m+1})/2$, $f_{m-0.5}$ = $(f_{m-1} + f_{m})/2$이다.

[증명]
함수 곱을 식 (1.1)에 넣고 정리해서 식 (1.3)을 증명한다. 나머지 차분도 동일하게 접근할 수 있다.

                  (1.4a)

                  (1.4b)
______________________________

식 (1.3b)의 마지막식은 차분 연산에 빈번하게 쓰이는 유용한 공식이다. 다만 좌변과 완벽히 같지는 않기 때문에, $h$가 0에 매우 가깝다는 조건이 필요하다.


[참고문헌]
[1] K. Mørken, Chapter 11. Numerical Differentiation, Numerical Algorithms and Digital Representation, University of Oslo, Norway, Nov. 2010. (방문일 2023-04-16)
[2] F. B. Hildebrand, Introduction to Numerical Analysis, 2nd ed., New York, USA: Dover Publications, 1987.

[다음 읽을거리]

2023년 2월 15일 수요일

오일러 각(Euler Angle)

[경고] 아래 글을 읽지 않고 "오일러 각"을 보면 바보로 느껴질 수 있습니다.


[그림 1] 고전 오일러 각의 기하학적 정의(출처: wikipedia.org)

3차원 공간에 위치한 한 점을 수학적으로 표현하기는 매우 쉽다. 예를 들면, 좌표계 기반 벡터(vector)를 도입해서 3차원 위치를 3개의 숫자 나열인 $(x, y, z)$라 쓸 수 있다. 혹은 방향 코사인(direction cosine)을 이용해 $(x, y, z)$대신 각도 관점인 $(r \cos \alpha, r \cos \beta, r \cos \gamma)$가 될 수도 있다. 여기서 $r$은 원점에서 특정 점까지 거리, $\alpha, \beta, \gamma$는 방향 코사인의 각도이다. 하지만 [그림 1]처럼 3차원 공간상에서 한 점이 회전한 경우를 수식으로 표현하기는 매우 까다롭다. 여기서 파란색인 $xyz$ 좌표축이 고정된 기준이며, 빨간색인 $XYZ$ 좌표축이 $xyz$에서 $XYZ$로 가는 3차원 공간의 회전을 적용한 결과이다.

[그림 2] 3차원 공간에서 회전하는 강체(출처: wikipedia.org)

원점에 강체(剛體, rigid body)가 있다고 생각해서, [그림 2]에 보인 한 점에 고정된 강체의 3차원상 회전을 써서 [그림 1]을 재해석하기도 한다. 강체는 칼로 상처를 낼 수 없는 견고한 물체 혹은 외력이 아무리 강해도 형상이 변하지 않는 물체를 뜻하는 물리학 용어이다.

[그림 3] $z$축에 대한 기본 회전 행렬 ${\bf R}_{\hat z} (\theta)$(출처: wikipedia.org)

한번에 [그림 1]에 보인 여러 회전을 이해하기는 어렵기 때문에, 우리가 생각할 수 있는 가장 간단하고 쉬운 기본 회전(elemental rotation)부터 상기한다. 기본 회전은 $xyz$ 좌표축에 대한 회전을 뜻한다. 예를 들어, [그림 3]에 나타낸 2차원 $xy$평면의 회전을 본다. [그림 3]은 $z$축을 기준으로 점 $(x, yz)$를 $\theta$만큼 회전한 점이 $(x', y')$임을 보여준다. 각 $x,y,z$축에 대한 기본 회전 행렬(elemental rotation matrix)은 다음과 같이 공식화된다. 아래 결과의 증명은 삼각 함수의 합차 공식(angle sum and difference identity)을 쓰면 된다.

                          (1a)

                          (1b)

                          (1c)

여기서 $\hat x, \hat y, \hat z$는 모두 단위 열 벡터(unit column vector), $\hat x$ = $[1~0~0]^T$, $\hat y$ = $[0~1~0]^T$, $\hat z$ = $[0~0~T]^T$이다. 식 (1)에 증명한 기본 회전 행렬을 도구로 3차원 공간상의 회전을 보여주는 [그림 1]을 이해한다. [그림 1]은 회전하지 않고 고정된 데카르트 좌표계(Cartesian coordinate system)인 $xyz$ 좌표계에서 시작해 3차원에서 임의로 회전한 또 다른 데카르트 좌표계인 $XYZ$ 좌표계로 바꾸는 절차를 보여준다. [그림 1]을 계속 보면 몇 가지 의문점이 생긴다. $xyz$ 좌표계에서 $XYZ$ 좌표계로 항상 갈 수 있을까? 기본 회전을 최소 몇 번 해야지 모든 회전을 다 표현할 수 있을까? 초보적이지만 근본적인 이 물음에 답한 최초의 수학자가 오일러Leonhard Euler(1707–1783)이다. 오일러는 1748년오일러 41세, 조선 영조 시절에 딱 3개의 각도인 $\alpha, \beta, \gamma$[이 각은 방향 코사인 각과는 완전히 다름]만 정의하면, [그림 1]의 알고리즘을 이용해 모든 3차원 회전을 표현할 수 있다는 성과를 제시했다. 이로 인해 [그림 1]에 나온 $\alpha, \beta, \gamma$를 오일러 각(Euler angle)이라 이름 붙인다. 오일러 각은 $\alpha, \beta, \gamma$ 대신 $\psi, \theta, \phi$를 쓰기도 한다. 오일러 각 $\alpha, \beta, \gamma$가 모든 3차원 회전을 나타내는 방식은 다음 절차를 따른다.
  • 두 $xyz$와 $XYZ$ 좌표계의 일부인 $xy$와 $XY$평면[각각 파란색빨간색 원]이 만나 생기는 녹색 직선을 마디선 혹은 절점선(line of nodes)이라 명한다. 마디선의 방향은 벡터 $\bar N$으로 표기한다.
  • $x$축이 벡터 $\bar N$과 만나도록 $z$축을 기준으로 $x$축을 각도 $\alpha$만큼 회전시켜서 $x'y'z$ 좌표계로 만든다. 수학적으로는 식 (1c)에 나온 ${\bf R}_{\hat z}(\alpha)$와 등가이다. 여기서 $x', y'$축은 $x, y$축이 회전된 결과이다. 벡터 $\bar N$은 마디선이라서 $x$축과 $\bar N$이 마주칠 수 있다.
  • 이번에는 $z$축과 $Z$축이 딱 붙도록 $x'$축을 기준으로 $z$축을 $\beta$만큼 돌리는 ${\bf R}_{\hat x'}(\beta)$ 연산을 적용한다. 그러면 $x'y''Z$ 좌표축이 새롭게 만들어진다. 여기서 $y''$축은 $y'$축을 다시 회전시킨 상태를 뜻한다.
  • $Z$축은 $XY$평면에 반드시 수직이므로, $Z$축에 수직인 $x', y''$축은 당연히 $XY$평면에 있다. 이 $x', y''$축이 $X, Y$축과 만나도록 $Z$축에 대해 $\gamma$만큼 선회시킨다. 이 연산은 ${\bf R}_{\hat Z}(\gamma)$가 된다.
  • 최종적으로 $\alpha, \beta, \gamma$ 각도로 회전을 3번 하면, 고정된 기준인 $xyz$ 좌표계를 임의로 놓인 $XYZ$ 좌표계에 딱 맞출 수 있다.
오일러 각이 만드는 회전 연산 혹은 행렬 $\bf R$은 식 (1)에 제시한 기초 회전 행렬을 이용해서 다음과 같이 정의한다.

                  (2a)

                          (2b)

여기서 $\bar {\bf u}$와 $\bar {\bf u}'$은 열 벡터(column vector), $\bar {\bf u}$ = $[x~y~z]^T$, $\bar {\bf u}'$ = $[x'~y'~z']^T$, $\bar {\bf u}'$은 벡터 $\bar {\bf u}$를 회전 행렬 $\bf R$에 따라 회전시킨 벡터, $\bar {\bf u}, \bar {\bf u}'$의 성분은 $xyz$ 좌표계로 기술한다.
우리가 적용하는 임의의 회전 연산은 식 (2b)와 같은 기본 회전 행렬의 곱이 일반적이지만 너무 많은 정보를 가져서 복잡해보인다. 그래서 회전의 기준인 회전축을 연산이 적용되는 순서에 따라 나열해서 식 (2b)를 $z$-$x'$-$Z$[회전축 $\hat z$, $\hat x'$, $\hat Z$ 순서로 기본 회전 행렬을 곱함] 혹은 $z$-$x'$-$z''$ 지향(orientation)으로 간략화한다. 더 간단하게 $z$-$x$-$z$로 기술하기도 한다. 회전축을 나열할 때는 먼저 적용하는 회전축부터 쓰기 때문에, 식 (2b)에 있는 회전 행렬의 오른쪽부터 왼쪽으로 회전축이 나와서 $z$-$x'$-$Z$가 된다. 회전축 시작은 각각 $x,y,z$축이 될 수 있고, 이 시작 회전축과 다른 2개의 축이 또 사용될 수 있어서 오일러 각을 정의하는 지향 나열(orientation sequence)은 총 6가지 경우가 있다.
  • $z$-$x'$-$z''$, $z$-$y'$-$z''$, $x$-$y'$-$x''$, $x$-$z'$-$x''$, $y$-$z'$-$y''$, $y$-$x'$-$y''$

[그림 4] 테이트브라이언 각의 기하학적 정의(출처: wikipedia.org)

[그림 1]에 나온 오일러 각은 쉽지만 $x,y,z$축 중에서 2개만 쓰는 방식이라서 다소 아쉽다. 이를 해결하기 위해 $x,y,z$축을 기준으로 모두 한 번씩 회전해서 임의의 $XYZ$ 좌표계를 맞추는 각도는 테이트–브라이언 각(Tait–Bryan angle)이라 정의한다. 각 좌표축의 회전을 한 번씩 모두 포함하는 방식이 기억하기 더 좋아서, 컴퓨터 그래픽스(computer graphics, CG) 분야에서는 3차원 임의 회전을 위한 각도로 테이트–브라이언 각을 주로 선택한다. 테이트–브라이언 각을 오일러 각이라 부르는 경우도 고려해서, [그림 1]과 같은 회전 연산에 쓰이는 각도는 특별히 고전 오일러 각(classic Euler angle) 혹은 정상 오일러 각(proper Euler angle)이라 명한다. 보통 고전 오일러 각에 $\alpha, \beta, \gamma$를 많이 쓰기 때문에, 테이트–브라이언 각은 주로 $\psi, \theta, \phi$로 표기한다. 테이트–브라이언 각를 제안한 테이트Peter Tait(1831–1901)는 사원수 역사에서 빼놓을 수 없는 소중한 물리학자이다. 맥스웰 방정식(Maxwell's equations)을 제안한 맥스웰James Clerk Maxwell(1831–1879)과 테이트는 동갑이며 동향인 죽마고우였다. 테이트는 사원수가 바탕인 고전적 맥스웰 방정식의 열렬한 지지자였고, 맥스웰이 죽은 후에도 사원수 기반 맥스웰 방정식을 지키려 피나게 노력했다. 하지만 1884년헤비사이드 34세, 조선 고종 시절에 헤비사이드Oliver Heaviside(1850–1925)가 어려운 사원수 대신 좌표계 기반 벡터(vector)를 쓰는 불손한 맥스웰 방정식을 제안해서 테이트를 매우 화나게 했다. 헤비사이드를 비난하며 사원수를 열심히 방어한 테이트의 분투에도 불구하고 연구자들은 헤비사이드의 맥스웰 방정식을 더 많이 활용했다. 테이트–브라이언 각의 또 다른 제안자인 수학자 브라이언George Bryan(1864–1928)도 보통이 아니다. 라이트 형제(Wright brothers)가 비행기를 날린 직후인 1911년브라이언 47세, 일제 식민지 시절에 브라이언은 곧 바로 비행기 자세 제어 이론을 성공적으로 개발했다. [그림 4]에서 테이트–브라이언 각인 $\psi, \theta, \phi$를 이용해 파란색 $xyz$ 좌표계를 임의로 놓인 빨간색 $XYZ$ 좌표계로 바꾸는 방법을 다음 순서로 제시한다.
  • $z$축을 회전축으로 해서 $x$축을 $\psi$만큼 회전시켜서, 마디선 벡터 $\bar N$에 수직인 벡터 $\bar N^\perp$에 $x$축을 딱 맞춘다. 여기서 $\bar N$의 방향은 $xy$와 $YZ$평면이 만난 선과 같다. 그래서 $y$축은 $\bar N$에 평행이 되며, 회전한 결과는 $x'y'z$가 된다.
  • 다음 단계로 $y'$축을 회전축으로 선택한 후, $x'$축을 $X$축에 맞도록 $\theta$만큼 돌린다. 두번째 회전으로 $Xy'z'$ 좌표계가 정의된다. $x'$축이 $X$축으로 움직일 수 있는 이유는 $y'$축에 기인한다. 즉, $y'$축은 $\bar N^\perp$과 $X$축에 수직이므로, $x'$축과 $X$축은 $y'$축을 법선 벡터로 하는 평면상에 있기 때문이다.
  • 마지막으로 $X$축이 회전축이 되어서 $y'$축과 $Y$축이 만나도록 $\phi$ 각도만큼 회전시켜서 모든 축이 $XYZ$ 좌표계와 만나도록 한다. 여기서 $y'$축은 빨간색 원으로 표시한 평면에 놓여있어서 $X$축을 기준으로 회전하면 반드시 $Y$축과 만난다.
조금 전에 적용한 지향 나열은 회전축 적용 순서대로 $z$-$y'$-$X$[회전축 $\hat z$, $\hat y'$, $\hat X$ 순서로 기본 회전 행렬을 곱함] 혹은 $z$-$y'$-$x''$이 되므로, 테이트–브라이언 각은 모든 좌표축을 전부 사용해서 회전을 한다. 지향 나열 $z$-$y'$-$X$가 만드는 회전 행렬은 다음과 같다.

                          (3)

테이트–브라이언 각의 지향 나열은 서로 다른 3개 축을 순열(permutation)하는 6가지 경우라서 다음처럼 헤아린다.
  • $z$-$x'$-$y''$, $z$-$y'$-$x''$, $x$-$y'$-$z''$, $x$-$z'$-$y''$, $y$-$z'$-$x''$, $y$-$x'$-$z''$
다만 식 (2b)와 (3)에서 보듯이 기본 회전 행렬을 식 (1)로만 쓰지 않고 회전한 좌표축을 다시 기준축[$\hat x'$, $\hat y'$, $\hat X$, $\hat Z$ 등]으로 삼아 재정의한 새로운 기본 회전 행렬도 필요하다. 이 과정은 매우 번거롭기 때문에, 실제 응용에서는 식 (1)처럼 회전축을 $xyz$ 좌표축으로만 고정한 기본 회전 행렬을 주로 쓴다. 이 두 회전 연산을 구별하기 위해, 식 (2b)와 (3)과 같이 회전한 좌표축을 다시 기준축으로 잡아 회전을 시키는 경우를 내재적 회전(intrinsic rotation)이라 한다. 내재적 회전과 다르게 회전하는 축을 항상 고정 좌표축[주로 $xyz$ 좌표축]으로만 선택하면 외재적 회전(extrinsic rotation)이라 이름 붙인다.

[그림 5] 회전 행렬 ${\bf R}_{\hat z}(\theta)$의 시각적 표현(출처: wikipedia.org)

쉬운 외재적 회전으로 복잡한 내재적 회전을 공식화하기 위해 [그림 5]와 같은 회전 행렬의 적용 과정을 재해석한다[2]. 회전 행렬의 원래 의미는 벡터 $\bar {\bf u}$를 회전 행렬 $\bf R$에 따라 회전시킨 결과가 행렬 곱 $\bar {\bf u}'$ = ${\bf R}\bar {\bf u}$라는 식 (2a)이다. 여기서 $xyz$ 좌표계는 움직이지 않고 고정되어 있으며, $\bar {\bf u}$와 $\bar {\bf u}'$은 모두 $xyz$ 좌표계에서 정의된다. 예를 들어, $\theta$ = $\pi/3$인 경우에 $\bar {\bf u}$ = $[1~0~0]^T$ = $\hat x$는 식 (1c)에 의해 $\bar {\bf u}'$ = $[1/2~\sqrt{3}/2~0]^T$ = $1/2\, \hat x + \sqrt{3}/2\, \hat y$로 변환된다. 다른 관점으로 회전 행렬 $\bf R$을 인식해서, 벡터 회전이 아닌 $x'y'z'$ 좌표(coordinate)를 $xyz$ 좌표로 바꾸는 방식도 상상할 수 있다. 좌표계를 간단히 부르기 위해  $xyz$와 $x'y'z'$ 좌표계를 $a$, $b$ 좌표계로 바꾼다. 좌상 첨자(left superscript)를 도입해서 식 (2a)의 벡터와 행렬이 정의된 좌표계를 명확히 한다.

                          (4a)

                          (4b)

여기서 좌상 첨자는 벡터나 행렬의 왼쪽 어깨에 붙은 첨자, ${}^a \bar {\bf u}$는 좌표계 $a$의 기저 벡터(basis vector)에 대한 성분으로 정의한 벡터[${}^a \bar {\bf u}$ = $(x, y, z)$ = $x\, {}^a\hat x + y\, {}^a\hat y + z\, {}^a\hat z$이며 ${}^a\hat x, {}^a\hat y, {}^a\hat z$는 좌표계 $a$의 기저 벡터], ${}^{a}{\bf R}_{b \to a}$는 좌표계 $b$ 기준으로 기술한 성분을 좌표계 $a$의 성분으로 바꾸는 회전 행렬, $\hat {\bf x}_{b \to a}$는 좌표계 $b$의 기저 벡터 $\hat {\bf x}$를 좌표계 $a$의 기저 벡터 성분으로 표현한다는 뜻이다. 이전의 예시를 식 (4a)로 설명하면 같은 결과이지만 조금 다른 의미를 가진다. 먼저 벡터 ${}^{b}\bar {\bf u}$ = $\bar {\bf u}$ = $[1~0~0]^T$는 좌표계 $b$의 $x$방향 기저 벡터[= ${}^b \hat x$]만 가지고 있다. 이를 좌표계 $a$의 성분(component) 혹은 좌표(coordinate)로 표현하려면 회전 행렬 ${}^{a}{\bf R}_{b \to a}$에 ${}^{b}\bar {\bf u}$를 곱한다. 그러면 ${}^{a}\bar {\bf u}$ = $\bar {\bf u}'$ = $[1/2~\sqrt{3}/2~0]^T$는 좌표계 $a$의 기저 벡터 성분으로 표현되어 ${}^{a}\bar {\bf u}$ = $1/2\, {}^{a} \hat x + \sqrt{3}/2\, {}^{a} \hat y$가 나온다[2]. 더 쉽게 생각하면, 식 (2b)는 고정 좌표계에서 입력 벡터를 회전시키는 회전기(rotator)이며, 입력과 출력 벡터는 회전하지 않는 고정 좌표계에서 정의된다. 반면에 식 (4b)는 벡터를 돌리지 않고 좌표계 $b$에 놓인 입력 벡터를 좌표계 $a$ 기준으로 해석하는 번역기(translator)로 작동한다. 회전 행렬을 회전기로 쓸지 번역기로 쓸지는 전적으로 사용자 몫이다.
회전 행렬을 식 (4b)로 생각해 식 (2b)의 회전 행렬을 고정된 좌표계 $a$의 외재적 회전으로 재정의한다. 유도에 앞서 식 (2b)로 정의한 오일러 각에 의해 좌표계는 $a \to b \to c \to d$ 순서로 변환된다고 가정한다. 좌표계 $a$ 혹은 $xyz$는 회전 연산과 무관하게 고정된다. 첫 단계로 좌표계 $a$의 기본 회전 행렬을 식 (4b)처럼 만든다.

                  (5)

식 (2b)에 나온 ${\bf R}_{\hat x'}(\beta)$는 좌상 첨자를 써서 다소 복잡한 ${}^a{\bf R}_{c \to b}$로 표현한다. 이는 좌표계 $c$의 성분을 좌표계 $b$의 기저 벡터 기준으로 번역할 때에 최종 결과는 좌표계 $a$의 기저 벡터 성분으로 공식화한다는 뜻이다. 이 개념에 식 (5)를 넣어서 ${\bf R}_{\hat x'}(\beta)$를 고정 좌표계 $a$의 기본 회전 행렬 곱으로 분해한다.

                  (6a)

                  (6b)

여기서 trans와 rot는 회전 행렬을 각각 번역기와 회전기로 사용한다는 의미이다. 회전 행렬의 의미를 명확히 함으로써 식 (6b)를 말로 설명할 수 있다. 처음에는 ${}^b{\bf R}_{a}$를 써서 좌표계 $a$의 벡터를 좌표계 $b$로 해석한다. 좌표계 $b$로 번역된 벡터를 회전기 ${}^b{\bf R}_{c \to b}$ = ${\bf R}_{\hat x} (\beta)$에 따라 좌표계 $b$에서 다시 회전시킨다.[벡터가 회전하는 방향은 $b \to c$] 마지막으로 이 결과를 좌표계 $a$로 재번역한다. 비슷한 방식으로 ${}^c{\bf R}_{d \to c}$도 기본 회전 행렬의 곱으로 공식화한다.

                  (7)

식 (7)과 (6b)를 식 (2b)에 대입해서 계산이 어려운 내재적 회전을 단순한 외재적 회전으로 변형한다.

                          (8)

식 (8)을 보면 내재적 회전 곱과 외재적 회전 곱은 각각 오른쪽에서 왼쪽, 왼쪽에서 오른쪽으로 서로 반대된 순서로 적용된다. 그래서 오일러 각에 대해 내재적 회전으로 정의한 지향 나열 $z$-$x'$-$z''$는 외재적 회전으로는 $z$-$x$-$z$가 된다. 특별한 고민없이 비슷하게 테이트–브라이언 각을 내재적 회전으로 정의한 식 (3)도 외재적 회전으로 바꾼다.

                          (9)

여기서 지향 나열 $z$-$y'$-$x''$은 $x$-$y$-$z$로 변한다.

(a) 이동하는 비행체

(b) YPR 연산 적용
[그림 6] YPR인 요, 롤, 피치를 이용한 비행체의 방향 전환(출처: wikipedia.org)

지향 나열 $z$-$y'$-$x''$(내재적 회전) 혹은 $x$-$y$-$z$(외재적 회전)는 워낙 유명해서 각 회전 연산에 이름이 붙어있다. 좌표축 $z, y, x$에 대한 회전은 각각 (yaw), 피치(pitch), (roll), 약자로는 YPR이라 부른다. 요는 통통배가 흔들거리며 제자리 회전하는 모습, 피치는 투수(pitcher)가 공을 던지는 행동, 롤은 돌림판(roller)의 회전을 표현하는 용어이다. 그래서 요, 피치, 롤을 그대로 직역하면 흔들기, 던지기, 굴리기이다. [그림 6]은 비행체가 $x$축을 따라 날아갈 때 회전 연산을 적용해서 비행체의 방향을 바꾸는 모양을 보여준다. 여기서 $z$축은 중력이 작용하는 방향의 반대로 놓이며, $\psi, \theta, \phi$는 식 (3)처럼 요, 피치, 롤의 각도이다. 비행체의 방향 변경에 쓰이는 회전 연산도 요, 피치, 롤이라 할 수 있지만, 비행체 이동을 더 강조하기 위해 YPR 대신 헤딩(heading), 고도(elevation), 뱅크(bank)로 바꿀 수 있다. 헤딩은 축구에 나오는 헤딩(heading)과 같은 뜻이며, 우리가 진행하는 머리 방향을 바꾼다. 고도는 당연히 비행체의 높이(elevation)에 변화를 주고, 뱅크는 선회할 때 경사면(bank) 영향처럼 비스듬하게 날아가게 한다. 그렇다면 헤딩, 고도, 뱅크는 향하기, 고도, 비스듬으로 번역할 수 있다.
외재적 회전으로 표현한 오일러 각 결과인 식 (8)을 계산해서 오일러 각의 회전 행렬 $\bf R$을 공식으로 만든다.

                  (10)

여기서 $c_\alpha$ = $\cos \alpha$, $s_\alpha$ = $\sin \alpha$이다. 최종 회전 행렬인 식 (10)의 원소를 관찰해서 오일러 각 $\alpha, \beta, \gamma$를 $\hat {\bf u}'$의 원소로 공식화할 수 있다. 먼저 마디선 벡터 $\bar N$을 $xyz$ 좌표계에서 $\hat z$, $\hat z'$으로 나타낸다.

                  (11)

여기서 $\hat z$ = $[0~0~1]^T$, $\hat z'$ = $[z_1'~z_2'~z_3']^T$이다. 벡터 $\bar N$은 마디선을 나타내고 있어서 $\hat z, \hat z'$에 항상 수직이어야 한다. 따라서 두 벡터 $\hat z, \hat z'$의 법선 벡터를 찾는 외적(outer product)을 써서 식 (11)처럼 $\bar N$을 구한다. 식 (10)과 (11)을 조합해서 $\alpha, \beta, \gamma$의 관계를 손쉽게 만들어낸다.

             (12)

여기서 $\hat x$ = $[1~0~0]^T$, $\hat y$ = $[0~1~0]^T$, $\hat x'$ = $[x_1'~x_2'~x_3']^T$, $\hat y'$ = $[y_1'~y_2'~y_3']^T$, $\bar N \cdot \hat y'$ = $\hat z \cdot (\hat z' \times \hat y')$ = $-x_3'$, $\bar N \cdot \hat x'$ = $\hat z \cdot (\hat z' \times \hat x')$ = $y_3'$, $\operatorname{atan2}(\cdot)$는 주치(principal value)가 $(-\pi, \pi]$ 혹은 $[0, 2 \pi)$인 2변수 탄젠트 역함수(2-variable arctangent function), $\gamma$는 $\bar N$에서 $x'$축으로 잰 각도라서 ($-$) 부호가 붙는다. 각도 $\beta$는 코사인 역함수로 구해져서 $\beta$의 주치는 $[0, 2 \pi)$가 아닌 반이 줄어든 $[0, \pi]$가 된다. 이와 비슷한 특성은 구 좌표계(spherical coordinate system)의 각도인 $\theta, \phi$에서도 나타난다. 최종 회전 행렬 $\bf R$에서 $\beta$ = $0, \pi$인 경우는 특성이 약간 이상해진다.

                  (13a)

                  (13b)

오일러 각 $\alpha, \gamma$가 각각 독립적으로 움직이지 않고, $\alpha \pm \gamma$와 같이 각도의 합이나 차로 변해서 오일러 각이 가진 자유도(degree of freedom) 하나가 사라진다. 오일러 각 자체는 문제가 없지만, 제어할 수 있는 자유도가 하나 사라져서 강체의 자세 조정에 문제가 생기는 현상을 전통적으로 짐벌 잠금(gimbal lock)으로 부른다.

(a) 짐벌의 좌표계
(b) 자유롭게 회전하는 짐벌

(c) 짐벌 잠금
[그림 7] 짐벌의 다양한 운동(출처: wikipedia.org)

[그림 7]에 보이는 짐벌 혹은 수평 유지기(gimbal)는 복잡하게 운동하는 강체의 수평을 맞출 때 사용하는 두 개의 고리이다. 짐벌이라는 말이 조금 어렵지만 어원을 생각하면 다소 수월하게 접근할 수 있다. 짐벌과 같은 어원을 가진 영어는 제미니(Gemini)이다. 제미니는 별자리중 쌍둥이 자리를 뜻해서, 짐벌에도 쌍둥이라는 개념이 있다. [그림 7]에서 명확하듯이, 짐벌에서 말하는 쌍둥이는 비슷한 모양으로 만든 2개의 고리를 가리킨다. 짐벌의 두 고리를 연결하는 축이 [그림 1]의 마디선 벡터인 $\bar N$이며, 안과 바깥 고리의 좌표계는 각각 $X, Y, Z$축과 $x, y, z$축을 [그림 1]과 같이 나타낸다. 두 고리의 $z$와 $Z$축을 평행하게 둔 경우를 $\beta$ = $0$이라 하면, $\beta$의 주치는 식 (12)와 같이 $[0, \pi]$가 된다. 조금 다르게 $z$와 $Z$축을 수직으로 만든 상태를 $\beta$ = $0$이라 할 수 있다. 이때는 $\beta$가 $[-\pi/2, \pi/2]$로 변하고, 짐벌 잠금은 $\beta$ = $\pm \pi/2$에서 생긴다. 짐벌 잠금으로 인해 생기는 제어 문제는 [그림 7(c)]에서 관찰할 수 있다. 두 고리가 같은 평면에 있으면, $\alpha, \gamma$를 아무리 바꾸어도 자세는 한 방향으로만 변한다. 각도 $\beta$가 짐벌 잠금 근처에 있어도 문제가 생긴다. 예를 들어, $\beta \approx 0$인 경우에 $z_3' \approx 1$, $z_1' \approx 0$, $z_2' \approx 0$, $x_3' \approx 0$, $y_3' \approx 0$ 정도로 근사화할 수 있다. 이 조건에서 $Z$축이 $z$축을 살짝만 넘어도 식 (12)에 의해 $\alpha, \gamma$가 불연속적으로 변해서 제어에 문제가 생길 수 있다. 구 좌표계에서 위치 벡터가 $\theta$ = $0, \pi$인 점을 넘을 때에 $\phi$가 불연속적으로 변하는 사례와 매우 비슷하다. 짐벌 잠금이 생긴다고 해서 오일러 각 자체가 문제가 있지는 않다. 식 (12)처럼 $\alpha, \beta, \gamma$를 삼각 함수의 역함수로 정의해서 나오는 문제라서 사원수(quaternion) 등으로 해결할 수 있다.
테이트–브라이언 각인 [그림 4]에서 $xy$와 $YZ$평면이 만드는 $\bar N$을 구할 때는 두 평면의 법선 벡터의 외적을 쓰면 된다. 이와 같은 방식은 [그림 1]에 나온 $\bar N$을 구하기 위해 평면의 법선 벡터 $\hat z, \hat z'$을 쓴 식 (11)과 동일하다.

                  (14)

여기서 $X$축의 단위 벡터는 $\hat x'$ = $[x_1'~x_2'~x_3']^T$이다. 식 (12)와 비슷하게 기하학을 써서 테이트–브라이언 각 $\psi, \theta, \phi$를 차례로 유도한다.

                  (15)

여기서 $\hat y'$ = $[y_1'~y_2'~y_3']^T$, $\hat z'$ = $[z_1'~z_2'~z_3']^T$, $\theta$는 $\bar N$을 기준으로 반대 방향으로 회전해서[회전축 $\bar N$을 기준으로 오른손 규칙으로 돌리는 각과 반대로 $\theta$가 회전] 부호를 $(-)$로 붙인다. 오일러 각 $\beta$처럼 각도 $\theta$도 주치가 $[-\pi/2, \pi/2]$로 줄어든다.

[참고문헌]
[2] D. Plein, "Extrinsic & intrinsic rotation: do I multiply from right or left?," Medium, May 2022. (방문일 2023-09-17)

[다음 읽을거리]