2023년 1월 10일 화요일

벡터 공간(Vector Space)

[경고] 아래 글을 읽지 않고 "벡터 공간"을 보면 바보로 느껴질 수 있습니다.


[그림 1] 2차원 벡터 공간(출처: wikipedia.org)

물체의 움직임을 성공적으로 기술하는 벡터(vector)에 벡터와 스칼라(scalar) 연산을 추가한 수학적 구성을 벡터 공간(vector space)이라 부른다. 우리가 직관적으로 인식할 수 있도록 벡터 공간은 벡터로 구축하고, 기본 요소인 벡터는 또 다른 재료인 스칼라와 벡터 공간에서 상호 작용하며 영향을 주고 받는다고 상상할 수 있다. 하지만 수학에서 공간(空間, space)은 더 폭넓은 개념을 가져서, 집합에 특정한 연산을 정의해 원소를 다양하게 계산할 수 있는 구조를 뜻한다. 따라서 벡터 공간은 집합의 원소가 벡터인 공간이며, 이 공간은 벡터와 스칼라의 다양한 계산 방식을 지원한다. 이러한 벡터 공간을 더 굳건한 수학적 기초에 올리기 위해, 기존 벡터 덧셈[$\bar u + \bar v$] 및 스칼라배[$a \bar v$]의 계산을 바탕으로 페아노Giuseppe Peano(1858–1932)는 독창적인 벡터 공간 $V$의 공리(公理, axiom)를 1888년페아노 30세, 조선 고종 시절에 제안했다.
  • 선형 결합(linear combination)과 닫힘(closure): $a \bar u + b \bar v \in V$
  • 벡터의 교환성(commutativity): $\bar u + \bar v$ = $\bar v + \bar u$
  • 벡터의 결합성(associativity): $\bar u + (\bar v + \bar w)$ = $(\bar u + \bar v) + \bar w$
  • 벡터의 항등원(identity element): $\bar v + \bar 0$ = $\bar v$
  • 벡터의 역원(inverse element): $\bar v + (-\bar v)$ = $\bar 0$
  • 스칼라의 항등원: $1 \bar v$ = $\bar v$
  • 스칼라의 교환성: $a(b\bar v)$ = $(ab) \bar v$
  • 분배성(distributivity): $a(\bar u + \bar v)$ = $a \bar u + a \bar v$, $(a + b) \bar v$ = $a \bar v + b \bar v$
여기서 벡터 공간인 집합 $V$의 원소는 벡터 $\bar u, \bar v, \bar w$이고, 스칼라 $a,b$는 사칙 연산이 잘 정의되는 체(體,field)인 집합 $F$의 원소, $\bar 0$은 영 벡터(zero vector)이다. 벡터 덧셈 $\bar u + \bar v$와 스칼라배 $a \bar v$를 바탕으로 벡터 뺄셈을 $\bar u - \bar v$ = $\bar u + (-\bar v)$로 정의한다. 그러면 벡터 공간의 공리로부터 다음 관계식도 쉽게 도출된다.
  • 스칼라의 항등원, 벡터의 역원: $1 \bar v$ = $\bar v$ $\Rightarrow$ $1 \bar v + (- \bar v)$ = $\bar v + (- \bar v)$ = $\bar 0$ $\Rightarrow$ $(-1) \bar v$ = $- \bar v$
  • 분배성, 벡터의 역원: $(1-1) \bar v$ = $\bar v + (-1) \bar v$ = $\bar v + (-\bar v)$ = $\bar 0$ $\Rightarrow$ $0 \bar v$ = $\bar 0$
  • 스칼라의 교환성: $c\bar 0$ = $c 0 \bar v$ = $(c0) \bar v$ = $0 \bar v$ $\Rightarrow$ $c \bar 0$ = $\bar 0$
여기서 $c$는 스칼라이다.
벡터 덧셈과 스칼라배를 유한 번 연속적으로 적용하여 새로운 벡터 $\bar w$를 만드는 선형 결합(linear combination)은 벡터 공간의 본질적인 연산이다.

                          (1)

벡터 공간 $V$에 속한 $\bar v_i$를 $n$개 모아서 다른 벡터 공간 $W$를 편성하는 과정은 생성 혹은 펼침(span)으로 부른다.

                          (2)

이 경우 $W$는 $V$의 부분 집합(subset)이므로, $W$는 다시금 벡터 공간의 공리를 모두 만족해서 $W$는 $V$의 부분 공간(subspace)이 된다. 참신한 관점으로 선형 결합으로 만든 두 벡터 공간 사이의 함수 관계는 선형 사상(linear mapping or linear map) $\mathfrak{L}: V \to W$를 이룬다.

                          (3)

식 (1)의 선형 결합처럼 선형 사상은 가법성(additivity) $f(\bar u + \bar v)$ = $f(\bar u) + f(\bar v)$ 및 동질성(homogeneity) $f(a \bar v)$ = $a f(\bar v)$를 충족해야 한다.
부분 공간 $W$는 벡터의 항등원을 가지기 때문에 식 (1)에서 $\bar w$ = $\bar 0$일 수 있다. 선형 결합을 만들 때, 영 벡터를 도출하는 유일한 조건이 $a_i$ = $0$인 경우를 선형 독립(linear independence)으로 정의한다.

                          (4a: 선형 독립)

벡터 공간의 선형 독립에 대한 의미 파악은 행렬(matrix)로 봐야 쉬워진다.

                  (4b)

연립 일차 방정식(simultaneous linear equations)인 식 (4b)가 풀리려면 벡터 $\bar v_i$로 구성한 $\bf V$가 역행렬(inverse matrix)을 가져야 한다. 이는 $\bf V$의 행렬식(determinant)이 0이 아니라는 뜻과 동일하다. 즉, $n$차원 공간에 만든 평행육면체(parallelepiped)의 부피가 0이 아닌 경우에 이 평행육면체의 각 점을 가리키는 벡터 $\bar v_i$는 선형 독립이다. 또한 행렬로 대상을 확대하지 않고 선형 독립을 벡터 공간 관점에서 이해하려고 식 (4a)를 뒤집어 생각한다.

                          (4c: 선형 종속)

어떤 $k$에서 $a_k$는 0이 아니라서 특정한 벡터 $\bar v_k$는 나머지 벡터의 선형 결합으로 표현된다. 따라서 $\bar v_k$는 다른 벡터와 선형 종속(linear dependence) 관계를 가진다. 다른 말로 선형 독립은 서로 다른 벡터의 선형 결합으로 절대 만들어낼 수 없는 개별적이고 고유한 벡터 관계이다.

[그림 2] 3차원 벡터 공간의 여러 가지 기저 선택(출처: wikipedia.org)

어떤 벡터 공간 $V$를 $V$ = $\text{span}(\{\bar v_1, \cdots, \bar v_n\})$처럼 생성할 수 있는 선형 독립인 벡터 $\bar v_i$는 벡터 공간의 기저(基底, basis)라고 한다. 기저는 벡터의 일종이라서 기저 벡터(basis vector)라고 구체적으로 이름 붙일 수도 있다. 하지만 벡터 공간의 기저는 유일하지 않다. 예시적으로 3차원 벡터 공간을 나타낸 [그림 2]를 본다. 여러 방향으로 기저를 자유롭게 선택해서 3차원 공간의 특성을 기술할 수 있다. 선형 독립인 기저의 개수는 벡터 공간의 차원 $\text{dim}(V)$이 된다. [그림 2]의 사례에서 3차원 벡터 공간은 $V_3$ = $\text{span}(\{\bar v_1, \bar v_2, \bar v_3\})$으로 펼쳐진다. 그러면 $V_3$의 차원은 $\text{dim}(V_3)$ = $3$이다. 벡터 공간이 주어질 때, 이 벡터 공간을 생성할 수 있는 기저의 개수인 차원은 기저의 선택에 관계없이 동일하다.

[벡터 공간용 차원 정리(dimension theorem for vector space)]
어떤 벡터 공간에서 임의로 뽑은 두 기저의 차원은 동일하다.

[증명]
벡터 공간 $V$의 기저를 $\bar u_i$ 및 $\bar v_i$라 두고, 기저 $\bar u_i$와 $\bar v_i$의 개수를 각각 $m, n$으로 가정한다. 여기서 차원 정리를 부정하기 위해 $m < n$로 설정한다. 그러면 기저 $\bar u_i$는 또 다른 $\bar v_j$의 선형 결합으로 명확히 공식화된다.

                  (5a)

여기서 $i$ = $1,2,\cdots,m$; $c_{ij}$는 확정된 계수이다. 두 기저, $\bar u_i$와 $\bar v_j$는 동일하게 $V$를 생성할 수 있기 때문에, 임의의 벡터 $\bar w$는 $\bar u_i$와 $\bar v_j$의 선형 결합으로 표현된다.

                  (5b)

여기서 $b_j$는 식 (5a)처럼 정해진 상수로 가정한다. 식 (5b)의 첫째식과 둘째식을 빼면 영 벡터가 나오고 $\bar v_j$는 선형 독립인 전제로 $a_i$에 대한 연립 일차 방정식을 유도한다.

                  (5c)

하지만 결정할 변수 $a_i$는 $m$개이고 방정식의 개수는 $n$개[$n > m$]라서 식 (5c)는 절대 풀려질 수 없다. 결국 두 기저의 차원은 $m$ = $n$으로 동일해야 한다.
______________________________

벡터 공간용 차원 정리란 명칭은 약간 어려워보이지만, 식 (5c)를 보면 변수와 연립 일차 방정식의 개수가 같아야 기저의 표현식이 유일하다는 상식적인 결론으로 벡터 공간용 차원 정리를 이해할 수 있다.

[그림 3] 네 가지 기본 부분 공간(fundamental subspaces): $\mathfrak{L}: \mathbb{C}^n \to \mathbb{C}^m$ 혹은 복소 행렬 ${\bf A} \in \mathbb{C}^{m \times n}$(출처: [2])

우리가 잘 알고 있는 기본 개념인 행렬 혹은 연립 일차 방정식의 해법을 벡터 공간으로 설명하는 바탕하에서 벡터 공간의 유용성과 파괴력은 더욱 증폭된다. 예를 들어, 3원 연립 일차 방정식은 $3 \times 3$ 행렬의 방정식으로 변환될 수 있다.

                          (6a: 연립 선형 방정식)

                          (6b: 행렬 방정식)

                          (6c: 열 벡터의 선형 결합)

                          (6d: 사다리꼴 형태)

여기서 $x, y, z$는 구해야 할 미지수, $\bf x$와 $\bf b$는 열 벡터(column vector)이다. 그러면 식 (6b)에 만든 행렬 $\bf A$의 각 열 벡터 $\bar v_j$와 미지수가 담긴 열 벡터 $\bf x$의 곱은 식 (6c)와 같은 선형 결합을 이룬다. 이때 각 선형 결합은 서로 선형 독립이 되어야, 해 $\bf x$가 유일하게 구해진다.

[그림 4] 선형 사상 $\mathfrak{L}: (x, y) \to (x, x)$의 영 공간: ${\bf x}_n$ = $(0, y)$는 영 공간의 벡터(출처: wikipedia.org)

그렇기에 $\bf Ax$ = $\bf b$를 바탕으로 행렬 $\bf A$에 대해 [그림 3]과 같은 기본 부분 공간(fundamental subspaces)을 정의한다[1]. 여기서 $\bf A$는 차원 $m \times n$을 가진다.
  • 열 공간(column space) 혹은 상공간(image), $\text{col}({\bf A})$ = $\text{image}({\bf A})$: 행렬 $\bf A$를 구축하는 열 벡터 $\bar v_j$로 만든 $\mathbb{C}^m$의 부분 공간
  • 영 공간(null space) 혹은 핵심(kernel), $\text{null}({\bf A})$ = $\text{ker}({\bf A})$: ${\bf A}{\bf x}_n$ = $\bf 0$을 만드는 열 벡터 ${\bf x}_n$이 만드는 $\mathbb{C}^n$의 부분 공간; ${\bf x}_n$은 연립 일차 방정식의 일반해(general solution)
행렬 $\bf A$에 영 공간이 존재하면 [그림 3]의 소개처럼 ${\bf A}({\bf x}_r + c {\bf x}_n)$ = $\bf b$로 나와서 방정식의 해는 ${\bf x}_r + c {\bf x}_n$과 같이 무한개로 생긴다.[증명은 선형 대수학의 기본 정리] 여기서 ${\bf x}_r$은 ${\bf A}{\bf x}$ = $\bf b$의 특수해(particular solution), $c$는 임의의 스칼라이다.
열 공간의 차원 $\text{dim}[\text{col}({\bf A})]$은 우리가 풀려는 연립 일차 방정식의 실제 개수이므로, 이 차원을 행렬의 계급수(階級數, rank) 혹은 계수(階數, rank) $r$ = $\text{rank}({\bf A})$로 이름 붙인다. 여기서 계수는 미지수와 곱해져 연계되는 수인 계수(係數, coefficient)와 한자가 다르며, 명확히 표현하려고 계급수라 쓸 수도 있다. 영 공간의 차원 $\text{dim}[\text{null}({\bf A})]$은 영인자(nullity) $\text{nullity}({\bf A})$로 명명한다.
행렬 방정식 $\bf Ax$ = $\bf b$에 전치 행렬(transpose)을 적용한 ${\bf x}^T {\bf A}^T$ = ${\bf b}^T$에서 유추해서, 방정식 ${\bf x}^T {\bf A}$ = ${\bf b}^T$에 대한 기본 부분 공간도 생성할 수 있다. 여기서 ${\bf x}^T$는 행 벡터(row vector)이다.
  • 행 공간(row space), $\text{row}({\bf A})$ = $\text{col}({\bf A}^T)$ = $\text{image}({\bf A}^T)$: 행렬 $\bf A$의 행 벡터 혹은 전치 행렬 ${\bf A}^T$의 열 벡터가 만드는 $\mathbb{C}^n$의 부분 공간
  • 좌영 공간(left null space) 혹은 여핵심(cokernel), $\text{null}({\bf A}^T)$ = $\text{ker}({\bf A}^T)$: ${\bf x}_n^T{\bf A}$ = ${\bf 0}^T$을 만드는 행 벡터 ${\bf x}_n^T$가 만드는 $\mathbb{C}^m$의 부분 공간
행렬, 행 공간, 열 공간의 계급수(rank)는 독립적인 양이 아니고 같은 양의 다른 이름이다.

[행 공간과 열 공간의 계급수(rank of row and column spaces)]
행 공간 $\text{row}({\bf A})$와 열 공간  $\text{col}({\bf A})$의 계급수는 행렬의 계급수 $r$ =  $\text{rank}({\bf A})$와 동일하다.

[증명]
식 (6b)와 같은 행렬의 계급수는 가우스 소거법(Gaussian elimination)의 기본 행 연산(elementary row operation)으로 변형한 식 (6d)의 사다리꼴 형태(echelon form)로 구한다. 즉, 사다리꼴 형태에서 대각선 원소가 0이 아닌 개수[대각선 원소의 곱은 행렬식(determinant) 혹은 지향된 부피(oriented volume)]가 바로 행렬의 계급수이다. 우리가 사용한 기본 행 연산은 행 공간의 선형 결합이므로, 행렬의 계급수는 행 공간의 차원과 동일하다. 열 공간의 선형 독립을 확인하기 위해 식 (6d)를 열 벡터의 선형 결합으로 관찰한다.

                  (7)

사다리꼴 형태로 간소화된 열 벡터 $\bar v_1', \bar v_2', \bar v_3'$의 선형 독립도 역시 대각선 원소의 0 여부로 판단할 수 있기 때문에, 열 공간의 차원도 행렬의 계급수를 따라간다.
______________________________

영 공간과 좌영 공간의 영인자(nullity)는 식 (9)에 유도한 계급수–영인자 정리(rank–nullity theorem)에 의해 행렬의 계급수와 연결된다.

[그림 5] 행렬의 곱셈 정의(출처: wikipedia.org)

영 공간 $\text{null}({\bf A})$이나 좌영 공간 $\text{null}({\bf A}^T)$의 벡터 ${\bf x}_n$, ${\bf x}_n^T$는 [그림 5]에 보인 행렬의 곱셈 정의로 쉽게 찾을 수 있다. 영 공간 $\text{null}({\bf A})$의 관점에서 열 벡터 ${\bf x}_n$과 $\bar A$의 행 벡터 $\bar u_i^T$의 벡터 내적(inner product on vector)은 $\bar u_i^T {\bf x}_n$ = $0$을 충족해야 한다. 벡터 공간 $V$의 두 부분 공간 $W, W^{\perp}$의 모든 벡터가 서로 직교하면, $W^{\perp}$는 $W$의 직교 여공간(直交餘空間, orthogonal complement)을 이룬다.

                          (7a)

여기서 $W \subset V$이다. 기본 부분 공간의 관계는 직교 여공간으로 재정립될 수 있다.

                          (7b)

여기서 행 공간과 영 공간의 벡터 및 열 공간과 좌영 공간의 벡터는 각각 직교한다.
연립 선형 방정식을 풀 때 필수적인 가치인 계급수–영인자 정리(rank–nullity theorem) 및 선형 대수학의 기본 정리(fundamental theorem of linear algebra, FTLA)를 차례로 증명한다.

[계급수–영인자 정리(rank–nullity theorem)]

                          (9)

여기서 행렬 $\bf A$의 차원은 $m \times n$이다.

[증명]
벡터 공간용 기저 정리에 따라 행 공간이 가질 수 있는 최대 차원은 기저에 관계없이 $n$이다. 하지만 행 공간의 기저는 선형 종속일 수 있어서 행 공간의 차원은 계급수 $r$ = $\text{rank}({\bf A})$로 나온다. 또한 식 (7b)를 활용하면, 이러한 행 공간에 직교하는 직교 여공간이 바로 영 공간이다. 주어진 선형 독립인 행 벡터에 직교하는 영 공간의 벡터는 그람–슈미트 과정(Gram–Schmidt process)으로 만들 수 있다. 다만 선형 독립인 벡터 개수는 $n$으로 제한되기 때문에 영 공간의 기저는 $n-r$까지만 생성된다. 비슷한 논리를 열 공간에 적용해서 식 (9)의 둘째식도 유도한다.
______________________________

선형 대수학의 기본 정리는 서로 직교하는 부분 공간으로 벡터를 표현하는 방식을 제시하는 표현 정리(representation theorem)이다. 이를 위해 두 벡터 공간 $V, W$를 합치는 연산을 소개한다. 먼저 중복을 허락해서 두 벡터 공간을 합집합(union)으로 더하는 벡터 공간의 합 $V+W$를 고려한다.

                          (10a)

여기서 $\bar u$는 $V \cup W$에 속한다. 벡터 공간 $V+W$의 기저는 $V, W$에 중복될 수 있어서 $V+W$의 차원은 다소 복잡하게 공식화된다.

                          (10b)

식 (10a)에서 두 집합 $V,W$의 교집합은 영 벡터 $\bar 0$만 공유하는 조건[∵ 벡터 공간의 공리를 만족하기 위해]을 적용해서, 기저를 중복하지 않고 벡터 공간의 합산을 구하는 직합(直合, direct sum)을 만들 수 있다.

                          (11a)

벡터 공간에서 직합을 만드는 쉬운 방법은 직교 여공간이다. 어떤 부분 공간 $W$와 직교 여공간 $W^\perp$는 직합을 구성할 수 있다. 만약 $W \oplus W^\perp$가 전체 공간(total space) $V$가 되면, $W^\perp$는 $W$의 영 공간이다. 여기서 전체 공간은 벡터 공간의 전체 집합에 해당한다.

[선형 대수학의 기본 정리(fundamental theorem of linear algebra, FTLA)] [3], [4]
차원 $m \times n$을 가진 행렬 $\bf A$가 구축한 연립 선형 방정식 $\bf Ax$ = $\bf b$는 다음처럼 풀린다.

                          (12)

여기서 $r$ = $\text{rank}({\bf A})$; $\bf b$는 열 공간 $\text{col}({\bf A})$의 열 벡터, ${\bf x}_r$은 $\bf Ax$ = $\bf b$의 특수해, ${\bf x}_{n,i}$는 영 공간의 선형 독립인 열 벡터, $c_i$는 임의의 스칼라이다.

[증명]
식 (7b)에 의해 행 공간과 영 공간의 직합은 전체 공간 $\mathbb{R}^n$ = $\text{row}({\bf A}) \oplus \text{null}({\bf A})$를 이룬다. 이럴 경우 계급수 $r$을 가진 행 공간은 $r$개의 유일한 특수해 ${\bf x}_r$을 산출할 수 있다. 또한 식 (9)에 의해 영 공간의 기저는 $n-r$개를 생성할 수 있어서 영 공간의 기저 ${\bf x}_{n,i}$로 선형 독립인 벡터를 $n-r$개 구축할 수 있다. 
______________________________

선형 대수학의 기본 정리는 선형 독립인 선형 방정식의 개수가 적더라도 선형 독립인 해를 도출할 수 있는 조화로운 길을 제시한다.

[참고문헌]
[1] G. Strang, Linear Algebra and its Applications, 4th ed., Brooks/Cole, 2006.
[2] R. van de Geijn and M. Myers, Advanced Linear Algebra: Foundations to Frontiers, University of Texas at Austin, TX, USA, 2020. (방문일 2024-02-11)
[3] G. Strang, "The fundamental theorem of linear algebra," Am. Math. Mon., vol. 100, no. 9, pp. 848–855, 1993.
[4] N. Hoell, "The fundamental theorem of linear algebra," University of Toronto, Canada. (방문일 2024-02-13)

[다음 읽을거리]

댓글 없음 :

댓글 쓰기

욕설이나 스팸글은 삭제될 수 있습니다. [전파거북이]는 선플운동의 아름다운 인터넷을 지지합니다.