2011년 7월 29일 금요일

전압파와 전류파(Voltage and Current Waves)

[경고] 아래 글을 읽지 않고 "전압파와 전류파"를 보면 바보로 느껴질 수 있습니다.
1. 전송선 이론

[확인] 본 페이지는 exp(jωt) 시간 약속을 사용하고 있습니다.


[그림 1] 원천과 부하를 연결하는 전송선(출처: wikipedia.org)

식 (1)의 전송선 방정식(transmission line equation)으로부터 직접적으로 얻어지는 결론은 전송선 이론(transmission line theory)의 전압과 전류는 더이상 회로 이론(circuit theory)의 전압과 전류가 아님이다.

                        (1)

여기서 $R, L, G, C$는 단위길이당 해당 회로량을 의미한다. 예를 들어 $R$의 단위는 Ω/m이다. 이를 확인하기 위해 식 (1)을 $z$에 대해 미분한다.

               (2)

식 (2)는 전형적인 상수 계수(係數常數, constant coefficient) 선형 상미분 방정식(常微分方程式, linear ordinary differential equation: 하나의 독립 변수만 가진 선형적인 미분 방정식)이므로 식 (2)의 답을 아래로 가정하고 식 (2)에 대입한다.

                        (3)

그러면 미지수인 $\gamma$를 결정할 수 있다.

                        (4)

식 (4)를 식 (3)에 대입해보면 식 (2)를 만족하는 해는 두 개임을 알 수 있다. 따라서, 전송선에 발생하는 전체 전압과 전류는 아래로 표현할 수 있다.

                        (5)

여기서 $V(z)$, $I(z)$는 회로 이론에서 배운 우리가 잘 아는 전압과 전류이며, $V_0^+$, $V_0^-$, $I_0^+$, $I_0^-$는 전송선 이론에 새로 도입된 파동의 진폭을 나타내는 계수로서 전압과 전류에 대한 경계 조건(境界條件, boundary condition)을 이용하여 정하게 된다. 식 (5)의 $V_0^+$, $V_0^-$, $I_0^+$, $I_0^-$에 있는 ($+$)와 ($-$)는 파동의 진행 방향이다. 즉,  ($+$)는 $+z$축, ($-$)는 $-z$축으로 진행하는 파동을 뜻한다. 따라서, $V_0^+$와 $I_0^+$는 $+z$축, $V_0^-$와 $I_0^-$는 $-z$축으로 진행하는 전압파와 전류파의 크기와 $z$ = $0$에서의 기준 위상을 표현한다. 또한, 식 (5)는 페이저(phasor)를 이용하여 시간 변동을 없앤 결과이기 때문에 실제로는 공간과 시간에 대해 전송선의 전압과 전류가 변하게 된다. 공간과 시간에 대해 식 (6)과 같이 변하면 파동(波動, wave)이라 하므로 전송선의 전압과 전류는 반드시 전압파(voltage wave)와 전류파(current wave)로 생각해야 한다.

                        (6)

전압파와 전류파는 회로 이론과 전송선 이론을 구별하는 매우 중요한 개념이다. 식 (5)와 (6)에서 $I_0^-$의 앞 부호는 ($-$)로 선택한다.[부호를 ($+$)로 택해도 전혀 문제없다.] 반사 전류파는 입사 전류파와 흐르는 방향이 다르다고 가정하면 편하므로 이렇게 정한다.


[그림 2] 전압파와 전류파의 움직임(출처: wikipedia.org)



[그림 3] 파면의 개념(출처: wikipedia.org)

[그림 2]처럼 전압파와 전류파는 전송선의 위치와 주어진 시간에 따라 계속 변하기 때문에 회로 이론처럼 어느 지점의 전압과 전류를 측정하기는 의미가 없다.[∵ 해당 위치에서 계속 변하기 때문이다.] 그래서, 전압파와 전류파가 이송하는 평균 전력(平均電力, average power)이 전송선 이론의 중요 지표이다.[평균 전력을 알려면 반사 계수(reflection coefficient)를 계산해야 한다.] 식 (6)을 잘 관찰하면 회로 이론과 전송선 이론의 차이점을 발견할 수 있다. 식 (6)의 좌변은 AC 회로 이론에서 측정하는 양이다.[∵ 전송선 방정식은 회로 이론을 기반으로 유도하기 때문에 $V(z), I(z)$는 회로 이론 양이다.] 식 (6)의 우변은 서로 반대 방향으로 진행하는 전압파와 전류파의 합성이다. 즉, 회로 이론의 전압과 전류를 파동의 성질을 가진 전압파와 전류파의 합성으로 설명할 수 있다. 예를 들면 식 (5)의 $V(z)$, $I(z)$가 회로 이론에서 정의한 전압과 전류이다. 이 전압과 전류는 전송선 이론의 입사[$V_0^+$항] 및 반사[$V_0^-$항] 전압파, 입사[$I_0^+$항] 및 반사[$I_0^-$항] 전류파로 분해해서 더 구체적으로 생각할 수 있다.
식 (6)의 우변이 파동을 의미한다는 뜻을 이해하기 위해 복소수(complex number)전파 상수(傳播常數, propagation constant) $\gamma$를 실수부와 허수부로 구분한다.

                       (7)

여기서 $\alpha$는 감쇠 상수(attenuation constant), $\beta$는 위상 상수(phase constant)이다. 감쇠 상수는 파동이 진행함에 따라 진폭이 얼마나 감소하는지를 나타내며 위상 상수는 파동의 진행에 따른 위상의 변동을 나타내는 상수이다. 위상 상수를 이용해 새로운 용어인 관내 파장(管內波長, guided wavelength) $\lambda_g$을 정의한다.

                       (8)

관내 파장은 전송선 내부에 존재하는 등가적인 파장(equivalent wavelength)을 뜻한다. 관내 파장은 전송선 매질과 기학 구조에 의해 결정된다.[더 정확하게 하려면 전송선의 모드(mode)까지 고려해야 한다.] 그래서 파동 방정식에 등장하는 파수(波數, wavenumber)를 위상 상수로, 파장을 관내 파장으로 비유해서 생각할 수 있다. 식 (7)을 식 (6)에 대입해서 위상만 고려하면 파동의 진행 방향도 얻을 수 있다.

                       (9)

                       (10)

파동의 움직임을 이해하려면 [그림 3]에 있는 파면(波面, wavefront)을 봐야 한다. [그림 3]을 보면 직관적으로 파동이 움직임을 느낄 수 있다. 파동이 왼쪽에서 오른쪽으로 움직이는 변화를 어떻게 인지할 수 있을까? 왜냐하면 우리가 눈으로 파면[예를 들면 꼭대기나 골짜기 등]을 추적해서 움직임을 이해하기 때문이다. 마찬가지로 식 (9)와 (10)에서 기준 파면을 $\phi_0$ = $0^\circ$인 지점으로 간주하면 이해가 된다. 시간이 $\Delta t$만큼 흐르면 식 (9)에 $\Delta z$가 $+z$ 방향으로 움직이고 식 (10)에서는 $\Delta z$가 $-z$방향으로[즉, 식 (9)와는 반대 방향으로] 움직인다. 이렇게 되는 이유는 위상 상수의 부호가 다르기 때문이다. 즉, 위상 상수가 ($+$)이면 파동은 $-z$방향으로 움직이며 위상 상수가 ($-$)이면 파동은 $+z$방향으로 움직인다. 따라서, 식 (6)의 $V_0^+, I_0^+$는 $+z$방향으로 움직이는 전압파와 전류파의 진폭이며 $V_0^-, I_0^-$는 $-z$방향으로 움직이는 전압파와 전류파의 진폭이다. 또한, 식 (9)처럼 주파수와 관내 파장의 곱이 전압파와 전류파가 움직이는 속도가 된다. 이 속도는 매질 특성인 $R, L, G, C$와 주파수에만 관계되는 상수이다. 식 (5)의 둘째식을 보면 $I_0^-$의 부호를 ($-$)로 설정한다. 이런 변화는 좀 이상하다. 이렇게 하는 이유는 전류의 방향을 바꾸기 위해서이다.[∵ 전류의 위상을 180˚ 바꾸면 전류 방향이 바뀐다.] 식 (5)와 같이 정의하면 파동의 진행 방향과 전류의 방향을 동일하게 만들 수 있어 계산할 때 매우 편해진다.[예를 들어 $I_0^-$의 부호를 ($+$)로 하면 파동은 $-z$쪽으로 움직이지만, 전류의 기준 방향은 $+z$방향이 되어 매우 불편해진다. 그래서, $I_0^-$의 부호를 ($-$)로 바꾸면 전류가 ($+$)인 방향은 $-z$쪽이 되어 계산이 편해진다.]
이상의 논의를 바탕으로 우리는 회로를 해석할 때 경우에 따라 회로 이론이나 전송선 이론을 사용할 수 있다. 언제 회로 이론을 쓰고 언제 전송선 이론을 써야 하나? 물론 전송선 이론이 정확하기 때문에 모든 회로 해석에 쓰일 수 있지만 너무 복잡하다. 회로 이론을 쓸 수 있는 곳에는 회로 이론을 쓰면 된다. 경험적으로 전송선 이론을 써야 하는 기준은 시스템의 크기 $D$가 관내 파장의 1/100보다 커지는 $D > \lambda_g / 100$ 경우이다. 예를 들어, 전송선의 길이를 1/100 파장으로 놓고, 회로 이론과 전송선 이론 간에 발생하는 위상 차이를 계산한다. 회로 이론에서는 단락된 도선을 따라 움직여도 신호의 위상은 변화가 없기 때문에, 위상차는 0˚라 생각한다. 반면 전송선에서는 전압파와 전류파의 이동으로 인해 필연적으로 위상 변화가 다음처럼 생긴다.

                       (11)

겨우 3.6˚라고 할 수도 있지만 판단 기준이 필요하기 때문에, 회로 이론을 쓸 수 있는 시스템의 크기 한계는 관내 파장의 1/100이라 생각한다. 시스템이 관내 파장보다 매우 작으면 아래 근사가 성립한다.

                       (12)

식 (12)의 우변 근사식은 많이 보던 모양이다. 이 식은 AC 회로 이론에서 사용한 페이저(phasor)이다. 사용하는 주파수가 매우 낮거나[혹은 사용하는 파장이 매우 길거나] 시스템의 크기가 매우 작으면 페이저[혹은 AC 회로 이론]만 쓰더라도 전압과 전류를 잘 예측할 수 있다. 거꾸로 주파수가 매우 높아지거나 시스템의 크기가 커진다면 회로 해석에 반드시 전송선 이론을 써야 한다.
식 (4)에서 $R$ = $G$ = $0$이 되면, 손실 없는 전송선(lossless transmission line)의 전파 상수가 된다.

                       (13)

손실을 일으키는 $R, G$가 없기 때문에 감쇠 상수가 0이 되어 손실이 없음은 당연하다. 이 경우 파동의 속도 $v$는 주파수에 관계없이 $L, C$에만 관계되어 항상 일정하게 된다.

                       (14)

식 (14)를 유전율(permittivity)과 투자율(permeability)로 표현하기 위해 커패시터(capacitor)인덕터(inductor)의 정의를 도입한다.

                       (15)

                       (16)

여기서 $L_{\rm ckt}, C_{\rm ckt}$는 회로 이론의 인덕턴스(inductance)와 전기 용량(capacitance)이다. 다음으로 전송선 내부에 존재하는 전자기파(electromagnetic wave)TEM(횡전자기, Transverse ElectroMagnetic: 진행 방향으로 전기장과 자기장 성분이 없음)파라 가정한다. TEM파는 전기장과 자기장이 서로 수직이며 전기장과 자기장의 비율[파동 임피던스: wave impedance]이 항상 일정하다. 그래서, 식 (15)와 (16)을 표현하는 좌표계를 간단하게 $(t_e, t_h, z)$로 정한다. 여기서 $t_e$는 전기장 방향 좌표이며 $t_h$는 자기장 방향 좌표이다.

                       (17)

그러므로, 전송선에 존재하는 파동의 속도는 항상 아래 식을 만족한다.

                       (18)

식 (18)은 전송선 내부에 전압파와 전류파가 존재하지만 손실이 없는 경우 그 파동의 속도는 전자기파의 속도(velocity of electromagnetic wave)와 동일함을 의미한다. 실제 전송선은 항상 손실을 가지기 때문에 $R$ = $G$ = $0$이라는 가정은 현실적이지 않다. 그래서 저손실 전송선(low loss transmission line) 개념을 도입한다. 손실이 낮으면 $R, L, G, C$ 관점에서 $R \ll \omega L$, $G \ll \omega C$라 가정한다. 그러면 식 (4)는 아래처럼 간략화된다.

                       (19)

식 (19) 유도를 위해 거듭제곱 함수(square root function)테일러 급수(Taylor series)를 이용한다. 재미있게도 식 (19)의 위상 상수는 손실 없는 전송선의 위상 상수인 식 (13)과 동일하다. 또한 실제 전송선로는 대부분 저손실 조건을 만족하기 때문에,[∵ 손실이 많으면 제품으로 판매할 수 없다.] 손실이 조금 있더라도 위상 상수 측면에서는 손실 없는 전송선으로 식 (19)처럼 근사가 가능하다. 그래서 실무에서는 식 (13)을 이용해 위상 상수를 근사적으로 정의한다. 식 (19)에 나타난 감쇠 상수 다음과 같이 특성 임피던스(characteristic impedance) $Z_0$를 이용해 더 간략히 표현할 수 있다.

                       (20)

여기서 $Z_0$ = $\sqrt{L/C}$ = $V_0^+/I_0^+$ = $V_0^-/I_0^-$이다. 식 (20)에 의해 $R$이 $G$보다 우세한 전송선로에서는 $Z_0$를 크게 설계해서 신호의 감쇠를 줄인다. 이는 전압파와 전류파의 특성에 기인하는 자연스러운 현상이다. 전송선로에 전류가 직렬로 흐를 때 생기는 손실 전력은 $R I^2$에 비례한다. 즉, 전류가 직렬로 흘러서 생기는 손실은 전류 자체를 줄여야 작아진다. 따라서 $Z_0$를 키우면 전압파 대비해서 전류파가 작아지기 때문에 전송선로에 생기는 전류가 줄어들어서 손실 전력이 작아진다. 이러한 전류파와 손실 전력의 관계를 식 (20)이 잘 설명하고 있다. 저항 밀도 $R$이 큰 경우와 비슷하게 컨덕턴스 밀도 $G$가 우세한 전송선로의 손실을 감소시키려면 $Z_0$를 줄여야 한다. 왜냐하면 전송선로에 병렬로 전압이 걸려서 생기는 손실은 $G V^2$에 비례하므로 $V$를 줄여야 감쇠가 줄기 때문이다. 그래서 $Z_0$를 줄이면 전류파 대비 전압파가 감소해서 $G$에 의한 손실도 적어진다.

[다음 읽을거리]
1. 특성 임피던스의 이해
2. 전압파의 반사 계수
3. 반사 전력과 투과 전력

2011년 7월 28일 목요일

전송선 이론(傳送線理論, Transmission Line Theory)

[경고] 아래 글을 읽지 않고 "전송선 이론"을 보면 바보로 느껴질 수 있습니다.
1. 전압
2. 전류
3. 저항
4. 커패시터
5. 인덕터
6. 정말 유용한 페이저 개념
7. 페이저를 이용한 임피던스 정의

[확인] 본 페이지는 exp(jωt) 시간 약속을 사용하고 있습니다.


[전송선에서 신호의 전송]

회로 이론(circuit theory)도 다들 어렵게 배우지만 이걸 배우고 나면 산너머 산이라고 또다른 거대한 복병을 만난다. 바로 전송선 이론(傳送線理論, transmission line theory)이다. 전압(voltage)전류(electric current)가 회로 상에 걸리는 방식을 공부하는 분야가 회로 이론이라면, 전송선 이론에서는 전압과 전류가 가만히 있지 않고 파동 형태로 전송선을 따라 계속 움직이는 특성을 정량적으로 설명한다. 이런 측면 때문에 전송선 이론 입문자는 많이 헤매게 된다. 너무 자책하거나 실망하지마라. 처음에는 다 그렇다. 핵심을 고민하고 여러 가지 예제를 공부하면 어느 순간에 완벽하게 이해하게 된다.

[그림 1] 전송선의 연결 모습(출처: wikipedia.org)

전송선은 말 그대로 [그림 1]과 같이 원천(source)과 부하(load)를 연결해주는 단순한 선이다. 말 자체는 어려움이 하나도 없다. 예를 들어, 회로 실험을 할 때 전압원과 저항을 선으로 연결해야 전기가 공급되어 전압과 전류를 측정할 수 있다. 이때 주로 사용하는 선로가 [그림 2]의 동축선(coaxial cable)이다.

   
[그림 2] 동축선(출처: wikipedia.org)

[그림 3] 회로망 분석기(출처: wikipedia.org)

예를 들어 [그림 3]의 회로망 분석기(network analyzer)가 발생시킨 전압과 전류를 [그림 2]의 동축선을 이용해 부하에 전기 형태로 공급해 정밀한 RF(Radio Frequency) 측정을 수행할 수 있다. 즉, 동축선과 같은 고품질의 전송선을 이용하면 거의 손실 없이 전압과 전류를 보낼 수 있다. 이런 동축선과 같은 전송선의 특징을 이해할 수 있게 해주는 이론이 전송선 이론이다. 이런 전송선 이론의 역사는 매우 길다.

[그림 4] 1891년 영국의 전신 시스템 배치도(출처: wikipedia.org)

[그림 4]는 영국이 1891년조선 고종 시절에 구축했던 전신 시스템(telegraphy system)의 전세계 배치도를 보여준다. 전세계에 있는 식민지와 원활한 정보 교환을 위해 영국은 전신 시스템 개발을 선도적으로 추진했다. 1885년헤비사이드 35세, 조선 고종 시절에 완전한 전송선 이론을 개발한 헤비사이드Oliver Heaviside(1850–1925)가 영국인임은 절대 우연이 아니다. 필요가 있어야 발명을 한다. 영국은 약 11년 후인 1902년대한제국 시절에 태평양을 횡단하는 전신선을 추가로 완성하여, 최초로 전세계를 아우르는 통신 시스템을 확보하게 된다.
[그림 4]에서 우리나라 주변을 보면, 한국인인 우리는 아주 복잡한 감정을 느끼게 된다. 1905년을사늑약(1905년 11월 7일)이면 허망하게 나라를 잃게 되는 조선은 우리 해역인 동해와 남해를 지나가는 전송선을 인지 했을까? 과학과 기술을 천시했던 조선 왕조는 1592년 임진왜란 이후 쇠락의 길을 걷게 되고, 조선의 멸절은 1876년에 일어난 일본과의 강화도 조약으로 시작된다. 이날 이후 조선은 국제 정세의 주도권을 잃고 끝없이 방황하게 된다. 지구 반대편에서 온 영국은 패러데이Michael Faraday(1791–1867), 켈빈William Thomson, Lord Kelvin(1824–1907), 맥스웰James Clerk Maxwell(1831–1879), 헤비사이드 등과 같은 과학사에 이름이 빛나는 과학자가 마련한 과학 기술을 바탕으로 우리나라를 포함한 전세계를 탐험했다. 반면에 과학 기술은 상것들이 하는 천한 일로 취급했던 조선은 결국 자기땅마저 소모적인 권력 투쟁으로 잃어버리고 1700만 민중을 위험으로 내몰았다. 대한민국에서 태어난 우리가 과학 기술을 공부하는 이유 중의 하나도 이런 역사를 반복하지 않으려는 절실함에 있을 것이다.
전송선 이론이 나온 시기는 맥스웰 방정식(Maxwell's equations)이 나온 20년 후이다. 이미 모든 현상을 설명하는 맥스웰 방정식이 있는데 굳이 전송선 이론이 나올 필요가 있었을까? 이에 대한 해답을 우리는 이미 안다. 맥스웰 방정식은 너무 어렵기 때문에 기술자가 가설해야 하는 전송선을 근사적으로 설명할 수 있는 이론이 실질적으로 필요했다. 이를 완벽하게 해결한 개념이 헤비사이드의 전송선 방정식(transmission line equation)이다. 전송선 방정식은 전신 기사 방정식(telegrapher's equation)이라고도 한다.

[그림 5] 전송선 미소 구간의 모형화

헤비사이드는 전력을 이송하는 전송선 미소 구간(微小區間, infinitesimal interval)을 [그림 5]와 같이 $R$(저항, resistor), $L$(인덕터, inductor), $G$(컨덕터, conductor), $C$(커패시, capacitor)의 상호 연결로 구성했다. $R$, $L$, $G$, $C$는 모두 다음과 같은 물리적 특성을 표현한다: 전류가 도선을 타고 흐르면 열 손실이 발생해 전압이 줄어들므로, 이 성분은 저항(resistance) $R$이다. 전류가 흐르면 필연적으로 자기장(magnetic field)이 생겨서 인덕턴스(inductance) $L$을 만든다. (+)극과 (-)극 사이는 아무리 잘 차폐를 해도 누설 전류(leakage current)가 흐르므로, 두 극 사이에는 컨덕턴스(conductance) $G$가 있다.[∵ 유전체로 절연을 시켜도 (+)극과 (-)극 사이에는 미세한 전류가 흐름, 건전지가 자연적으로 방전되는 현상도 유사] 전압을 걸어주면 당연히 전하(electric charge)가 모이고 전기장(electric field)도 생기므로, 이 현상을 전기 용량(capacitance) $C$로 모형화한다. 여기까지만 보면 회로 이론과 대동소이하지만, $R$, $L$, $G$, $C$가 존재하는 영역에 길이 $\Delta z$를 도입한 전송선 개념은 혁명적이다. 왜냐하면 벡터 파동인 전기장과 자기장을 스칼라로 표현한 전압과 전류도 파동적 속성을 가져야 하기 때문이다. 즉 파동(波動, wave)은 시간과 공간의 변화가 모두 존재해서 주변으로 퍼져나가야 하지만, 예전 회로 이론에는 시간 변화[$d/dt$ 혹은 $j \omega$]만 있어서 파동을 표현할 수 없는 근원적 문제가 있었다. 헤비사이드는 [그림 5]와 같은 길이가 있는 미소 구간을 정의해서 공간적 변화를 줄 수 있는 물리적 기반을 만들었다.  

[그림 6] 미소 구간을 연결한 전송선의 모형화

헤비사이드는 [그림 5]의 미소 구간을 [그림 6]과 같이 무한히 붙이면 [그림 2]와 같은 실제 전송선이 된다고 가정했다. 다만 전송선을 저항, 인덕턴스, 컨덕턴스, 전기 용량의 조합으로 표현하지 않고, 미소 구간을 표현하기 위해 단위 길이당 저항, 인덕턴스, 컨덕턴스, 전기 용량인 $R, L, G, C$를 각각 도입했다.[전송선에 등장하는 회로량은 선로 특성을 나타내기 위해 선형 밀도로 사용함을 꼭 기억해야 한다.] 그래서 [그림 5]에 대해 회로 이론의 KVL(Kirchhoff Voltage Law), KCL(Kirchhoff Current Law)임피던스(impedance) 관점으로 적용할 수 있다.

                        (1)

여기서 $z$는 전력을 전달하는 방향, $\Delta z$는 미소 구간의 길이, $R, L, G, C$는 선형 밀도(linear density)인 단위 길이당 해당 회로량을 의미한다. 예를 들어 $R, L, G, C$의 단위는 각각 Ω/m, H/m, S/m, F/m이다. 식 (1)의 첫째식은 전압에 대한 KVL을 [그림 5]에 적용하면 쉽게 얻어진다. 즉, 걸어준 전압 $V(z)$를 기준으로 보면 [그림 5]는 병렬 회로이므로 $V(z)$는 $R$, $L$에 걸린 전압과 $V(z+\Delta z)$의 합과 같아야 한다. 물론 $R$, $L$에 흐르는 전류는 $I(z)$이므로 옴 법칙을 통해 $R$, $L$에 걸린 전압을 구할 수 있다. 식 (1)의 둘째식도 유사한 방법으로 구한다. 전류에 대한 KCL로 보면, 직렬 구성인 $R$와 $L$을 통과할 때 전류는 변함없이 $I(z)$가 된다. 직렬 회로를 나온 $I(z)$는 $G$, $C$ 및 출력 단자(端子, port)를 통해 분류된다. 여기서 $G$, $C$에 걸리는 전압은 $V(z+\Delta z)$이므로 옴 법칙을 이용해 $G$, $C$로 빠져나가는 전류를 구할 수 있다. 또한 [그림 5]처럼 출력 단자로 방출되는 전류는 $I(z+\Delta z)$가 된다. 그래서 식 (1)에서 $\Delta z \to 0$이 되면 최종적인 전송선 방정식을 다음처럼 얻을 수 있다.

                        (2)

식 (2)는 저항과 컨덕터의 성질을 이용해서도 이해할 수 있다. 전압 관점에서 [그림 5]를 보면 저항이 직렬로 있으므로 거리 $z$가 증가함에 따라 저항에 전압이 걸리므로 전압은 계속 감소해야 한다. 즉, 전압의 기울기는 (-)가 되어야 한다. 전류 관점에서는 컨덕터가 병렬이기 때문에 거리 $z$가 증가함에 따라 누설 전류가 계속 생겨 전류는 계속 감소해야 한다. 그래서, 전류의 기울기는 (-)가 된다. 전송선에 흐르는 전압과 전류를 상상하려면 전기장(electric field)자기장(magnetic field) 개념으로 접근해야 한다. 이를 위해 [그림 1] 회로를 고려하자. 위쪽선에 (+) 전압을 가하고 아래쪽선에 (-) 전압을 가한다고 생각하자. 그러면 (+)에서 (-)로 가는 전기장이 생긴다. 이 전기장이 전송선을 통해 흐른다. 그런데 전기장 개념은 어렵기 때문에 우리에게 익숙한 전압으로 바꾸어 사용한다. 전기장이 걸리면 당연히 이 전기장은 움직여야 하므로[∵ 패러데이 법칙(Faraday's law)을 생각하라.] 마치 전압의 움직임으로 상상할 수 있다. 전송선 이론에서는 이런 전압 특성 때문에 단순히 전압이라 하지 않고 전압파(voltage wave)라고 정의한다. 전압파라는 의미는 전압이 전송선을 타고 움직인다는 뜻이다. 전류도 마찬가지로 생각할 수 있다. 전송선의 위와 아래에 전압을 걸면 필연적으로 전류가 흐른다.[∵ (+) 전압은 (-) 전하를 잡아당기고 (-) 전압은 (-) 전하를 밀기 때문에] 전류가 흐르면 암페어 법칙(Ampere's law)에 의해 자기장이 생기므로 실제로는 자기장이 전달된다. 하지만 자기장 개념은 힘들기 때문에 대신 전류로 바꾸어 생각한다. 전류는 자기장과 함께 움직이고 있으므로, 이 경우도 전류파(current wave)라 부른다.
전송선 이론에 나오는 생소한 개념은 집중 회로 소자(集中回路素子, lumped circuit element)분포 회로 소자(分布回路素子, distributed circuit element)이다. 어렵게 생각할 필요는 없다. 보통 회로 이론에 나오는 저항, 커패시터, 인덕터가 집중 회로 소자이다.

[그림 7] 실제 저항 모습(출처: wikipedia.org)

[그림 8] 실제 커패시터 모습(출처: wikipedia.org)

[그림 9] 실제 인덕터 모습(출처: wikipedia.org)

집중 회로 소자는 말 그대로 $R, L, C$가 한 곳에 집중되어서 분리해서 생각할 수 있는 소자이다. 반면에 분포 회로 소자는 $R, L, C$가 전체에 골고루 분포되어 있어 $R, L, C$를 분리해서 생각할 수 없는 소자이다. 수학적으로 말하면 분포 회로 소자는 아무리 작게 잘라가도 $R, L, C$를 분리해낼 수 없고 항상 $R, L, C$가 연결된 형태로 있다. 우리가 배우는 부품 중에서 대표적인 분포 회로 소자가 전송선이다. [그림 5]를 보면 $R, L, C$가 집중 회로 소자로 표시되어 있지만 $\Delta z \to 0$으로 가서 식 (1)처럼 단위 길이당 $R, L, C$로[혹은 밀도로만] 정의하기 때문에 전송선은 분포 회로 소자가 된다.

[참고문헌]
[1] S. A. Schelkunoff, "Forty years ago: Maxwell's theory invades engineering—and grows with it," IEEE Trans. Antennas Propag., vol. 18, no. 3, pp. 309–322, May 1970.
[2] A. A. Oliner, "Historical perspectives on microwave field theory," IEEE Trans. Microw. Theory Tech., vol. 32, no. 9, pp. 1022–1045, Sep. 1984.

2의 제곱근은 무리수(Irrational Number)

[그림 1] 무리수 $\sqrt{2}$의 기하학적 표현(출처: wikipedia.org)

피타고라스 시절부터 알려진 2의 제곱근이 무리수(無理數, irrational number)라는 사실은 실수의 성질을 연구할 때에 두루 두루 쓰인다. 아주 오래전부터 알려진 무리수의 성질이 극한(limit)미분(differentiation)의 기저를 이루는 실수의 완비성(completeness of real numbers)과 관계가 있음은 매우 재미있는 사실이다. 무리수는 두 정수의 비율로 나타낼 수 없는 수이므로 상상의 수라 생각할 수 있다. 하지만 [그림 1]을 보면, 밑변과 높이의 길이가 1인 직각 삼각형의 빗변은 $\sqrt{2}$이므로 분명히 현실에 존재하는 수이다. 또한 무리수의 반대는 유리수(有理數, rational number)라고 한다. 유리수는 두 정수의 비율로 표현할 수 있는 합리적인 수이다. 일설에는 합리성(rational)이라는 개념[4]이 들어간 유리수와 무리수 명칭 대신에 비율(ratio)을 명시한 유비수(有比數, 비율이 있는 수)와 무비수(無比數, 비율이 없는 수)가 더 타당하다는 의견이 있다. 
2의 제곱근이 무리수임을 증명하기는 매우 쉽다. 이미 기원전 300년경한반도 철기 시대 시작에 유클리드Euclid(대략 기원전 325–265)가 쓴 원론(Elements)에도 이 증명이 소개되어 있기 때문이다[1]. 2의 제곱근이 무리수임을 증명하기 위해 $\sqrt{2}$가 유리수라고 가정한다. $1 < \sqrt{2} < \sqrt{4}$ = $2$가 성립하므로 분모가 1이 아닌 분수로 표현된다.

                        (1)

여기서 $m, n$은 서로 약분할 수 없고 $n$ = $2p$로 가정하였다. 식 (1)에서 짝수$^2$ = 짝수[$2a \cdot 2a$ = $4a^2$ = $2(2a^2)$], 홀수$^2$ = 홀수[$(2a+1)(2a+1)$ = $2(2a^2+2a)+1$]가 되므로 $m, n$은 짝수가 되어 약분할 수가 있게 된다. 이 사실은 가정을 위배하므로 $\sqrt{2}$는 식 (1)로 표현할 수 없다. 즉, 분수로 표현할 수 없기 때문에 무리수가 되어야 한다. 이 개념을 확장하면 모든 제곱근에 대해 아래 명제를 증명할 수 있다.

[거듭제곱수가 아닌 모든 거듭제곱근은 무리수]
거듭제곱해서 자연수가 되지 않는 모든 거듭제곱근은 무리수이다.

                         (2)

여기서 $p, q$는 자연수이다.

[증명]
식 (2)를 조금 더 쉽게 말하면 $p$는 자연수이고 $p$의 거듭제곱근이 자연수가 아닌 경우, $p$의 거듭제곱근은 항상 무리수이다. 이런 이해를 바탕으로 식 (2)를 증명한다. 기본적인 증명 방법은 식 (1)과 유사하다. 식 (2)에서 $p$의 거듭제곱근은 거듭제곱수가 아니기 때문에[혹은 $p$는 어떤 수의 거듭제곱이 아니기 때문에] $p$의 거듭제곱근을 분모가 1이 아닌 분수로 표현할 수 있다.

            (3)

$m_1, m_2, \cdots, m_M$은 $n_1, n_2, \cdots, n_N$과 서로소(素, relative prime)이지만 식 (3)과 같이 $p$를 거듭제곱하면 $m_1, m_2, \cdots, m_M$은 $n_1, n_2, \cdots, n_N$을 나눌 수 있어야 한다. 하지만 이 사실은 가정에 위배되므로 식 (3)과 같은 유리수로 표현할 수 없다. 혹은 배수 개념으로 보더라도 마찬가지이다. $(m_1 m_2 \cdots m_M)^q$의 배수 중 하나는 $(n_1 n_2 \cdots n_N)^q$이어야 한다. 하지만 $m_1^q$의 배수는 $(n_1 n_2 \cdots n_N)^q$이 될 수 없다. 그 다음 모든 수인 $m_2^q, \cdots, m_M^q$도 마찬가지이다. 그래서 식 (3)은 유리수로 표현할 수 없다.
______________________________

식 (3)의 증명이 깔끔하기는 하지만 소인수 분해(素因數分解, prime factorization)에 대한 이해가 있어야 완벽한 증명이 된다. 모든 수는 솟수(素數, prime number)만으로 분해할 수 있는가? 분해 관점에서 솟수 외에 다른 수가 필요한가? 솟수만으로 처리한 소인수 분해는 유일한가? 이 질문에 답할 수 있다면, 아래 산술의 기본 정리(fundamental theorem of arithmetic)를 쉽게 증명할 수 있다[2], [3]. 그러면 수학의 여왕이라고 하는 정수론(整數論, number theory)으로 성큼 다가가게 된다.

[산술의 기본 정리]
1을 제외한 모든 자연수는 솟수의 곱으로 유일하게 표현된다.

[증명]
모든 자연수가 솟수(素數, prime number)로만 표현되는지부터 증명해본다. 솟수는 1과 자기 자신을 제외한 수로는 나눌 수 없는 수이다.[1989년부터 시행된 한글맞춤법에 따르면 소수(素數, prime number)로 해야 타당하나, 소수(小數, decimal fraction)와 구별되지 않으므로 옛날 표기인 솟수를 고집한다.] 관찰을 통해 합성수 $n$은 1이 아닌 어떤 두 수의 곱 $n_1, n_2$로 표현됨을 쉽게 알 수 있다.[∵ 솟수 정의에 의해 합성수(合成數, composite number)는 나눌 수 있기 때문에 두 수의 곱으로 항상 표현 가능하다.] 이를 이용하면 아래를 얻는다.

                        (4)

식 (4)에서 분해한 수가 솟수가 되면 더 이상 진행하지 않는다. 이런 식으로 합성수를 두 수의 곱으로 분해하면 최종적으로 솟수만 남는다는 성질은 쉽게 증명된다. 그런데 이렇게 찾은 소인수 분해가 유일한가를 다시 증명해야 한다. 소인수 분해가 유일하지 않다면 두 가지 다른 종류의 솟수로 합성수를 분해할 수 있다. 이런 합성수 중에서 가장 작은 수를 $n$이라 둔다.

                         (5)

여기서 $p_1, p_2, \cdots, p_M$과 $q_1, q_2, \cdots, q_N$은 크기순으로 배열했으며[$p_1 \le \cdots \le p_M$, $q_1 \le \cdots \le q_N$] $p_i$와 $q_i$는 서로 같지 않다.[∵ 같으면 서로 나누어주면 된다.] 또한, $q_1$은 $p_1$보다 크다고[$p_1 < q_1$] 가정했다. 식 (5)의 셋째 줄에서 $q_1$ = $a p_1 + b$를 대입하여 새롭게 정의한 합성수 $m$은 공통 인수 $p_1$이 있으므로 전체는 $p_1$으로 나누어진다. 하지만 우변은 $p_1$대신 $b$가 있으므로 새로운 소인수 분해가 된다.[∵ $b$를 가진 소인수 분해인 $bq_2 \cdots q_N$은 절대 $p_1$ 인수를 가질 수 없기 때문이다. 즉, $b < p_1$이며 $q_2, \cdots, q_N > p_1$.] 증명을 위한 가정에서 $n$이 두 가지 소인수 분해가 가능한 최소수라고 했지만 $m$은 항상 $m < n$이 되므로 가정에 위배된다. 이는 두 가지로 소인수 분해할 수 있는 최소 합성수는 없다는 결론을 이끈다. 합성수는 최소수가 있는데 두 가지로 소인수 분해할 수 있는 최소 합성수가 없기 때문에 합성수를 두 가지 방식으로 소인수 분해할 수 없다는 뜻이다. 따라서, 소인수 분해는 유일해야 한다.
______________________________

위의 증명 중 $q_1$ = $a p_1 + b$라고 확정한 부분은 놓치기 쉬운 허점 중 하나이다. 나눗셈의 원리에 속하는 이 명제는 증명이 필요한 부분이다. 이에 대한 증명은 나눗셈의 유일성에 제시되어 있다. 또한 $1$이 솟수인지 아닌지에 대한 논란이 있었지만, 산술의 기본 정리로 인해 $1$은 더 이상 솟수가 아니다. 만약 $1$이 솟수라면 산술의 기본 정리는 성립하지 않는다. 예를 들어 $1$을 포함하면 $6$ = $2 \times 3$ = $1 \times 2 \times 3$ = $1 \times 1 \times 2 \times 3$ =$ \cdots$이 성립하므로, 솟수의 소인수 분해는 무한하게 된다. 이와 같이 풍성한 결과를 만들어내는 산술의 기본 정리를 정수론의 대가인 가우스Carl Friedrich Gauss(1777–1855)가 1801년가우스 24세, 조선 순조 시절에 엄밀하게 다시 증명한 사실은 우연이 아니다[2]. 산술의 기본 정리는 정수론으로 가는 손쉬운 지름길이므로, 위의 기본 정리 증명을 이해할 때까지 계속 본다.


   1. 기본(basics)   

[곱셈의 역수(multiplicative inverse)]

                         (1.1a)

                         (1.1b)

[증명]
식 (1.1)의 우변에 있는 분수의 분모와 분자에 $1 - \sqrt{1+x}$ 혹은 $a - \sqrt{a^2+x^2}$을 각각 곱해서 정리한다.
______________________________

식 (1.1)은 거듭제곱을 분모로 보내는 공식이라서, 역쌍곡 함수(inverse hyperbolic function) 공식을 계산할 때 유용하다.


[참고문헌]
[2] A. G. Ağargün and E. M. Özkan, "A historical survey of the fundamental theorem of arithmetic," Historia Mathematica, vol. 28, no. 3, pp. 207–214, Aug. 2001.
[3] 강윤수, "소인수분해정리와 유클리드의 원론", 한국수학사학회지, 제17권, 제1호, pp. 33–42, 2004년 2월.
[4] 허민, "수학에 쓰이는 한자말에 대한 소고", 한국수학교육학회 시리즈 E: 수학교육 논문집, 제30권, 제2호, pp. 121–138, 2016년 5월.

[다음 읽을거리]
1. 나눗셈과 진법

2011년 7월 26일 화요일

단조 증감 수렴 정리(單調增減收斂定理, Monotone Convergence Theorem)

[경고] 아래 글을 읽지 않고 "단조 증감 수렴 정리"를 보면 바보로 느껴질 수 있습니다.
1. 평균값의 정리
2. 중간값의 정리
3. 극값의 정리
4. 극한과 연속성의 의미


해석학(解析學, analysis)을 공부할 때 증명은 이해가 되지만 이런 부분을 증명해야 하는 이유를 알 수 없는 정리중의 하나가 단조 증감 수렴 정리(單調增減收斂定理, monotone convergence theorem)이다. 단조 증감 수렴 정리는 단조 증가하는 수열이 위로 유계(有界, bounded)일 때나 단조 감소하는 수열이 아래로 유계일 때 반드시 수렴한다는 정리이다. 단조 증감 수렴 정리는 너무 직관적으로 이해가 되기 때문에 굳이 증명해야 하는지도 의심스럽다. 한계가 있는 상태에서 그 방향으로 계속 진행하면 언젠가는 한계에 다다를 수 있지 않는가! 그래서, 수학자 코쉬도 단조 증감 수렴 정리를 증명하지 않고 성립한다고 가정하고 사용하였다.

[그림 1] 단조 증가하는 함수의 예(출처: wikipedia.org)

[그림 2] 커패시터가 충전되는 모습(출처: wikipedia.org)

단조 증가함은 [그림 1]처럼 $x$가 증가할 때 함수값 $f(x)$가 감소하지 않음이다. 즉, 감소하지 않음은 증가하거나 제자리 걸음을 할 수 있음이다. 우리가 커패시터(capacitor)에 전압을 채우면 [그림 2]와 같은 단조 증가 특성을 얻을 수 있다. 시간이 무한대로 흐르면 커패시터에는 내가 걸어준 전압이 걸리게 된다. [그림 2]를 보면 $x$가 증가할 때 함수값 $f(x)$가 수렴하는 모습은 당연해보인다. 그런데 세상에는 당연한 사실을 고민하는 사람들도 많다. 단조 증감 수렴 정리 증명을 통해 우리는 실수(實數, real number)의 완비성(完備性, completeness)을 느낄 수 있다. 실수의 완비성(completeness of real numbers)은 모든 실수를 순서대로 나열해 만든 수직선(數直線, number line)에는 빈 공간이나 빠진 점이 전혀 없음을 뜻하는 공리(公理, axiom)이다.

[단조 증감 수렴 정리]
단조 증감하는 수열이 유계이면 반드시 수렴한다.

[증명]
먼저 단조 증가하는 수열 $\{a_n\}$을 생각해본다. 단조 증가하기 때문에 $a_1 \le a_2 \le \cdots \le a_n \le \cdots$가 성립한다. 또한 실수의 완비성[실수를 이용하면 수직선을 빠짐없이 채울 수 있음]에 의해 수열 $\{a_n\}$의 최소 상계(最小上界, supremum or least upper bound)가 반드시 존재해야 한다. 이 최소 상계값을 $L$이라고 한다. 그러면, 임의의 $\epsilon > 0$에 대해 $L - a_N < \epsilon$을 만족하는 $N$을 항상 발견할 수 있다. 그러면, 아래가 항상 성립한다.

                       (1)

그러면 수열의 수렴(convergence of sequence) 정의에 의해 다음이 성립한다.

                                    (2)

단조 감소 증명은 위의 증명을 약간만 바꾸면 쉽게 할 수 있다. 
______________________________

위의 증명을 보면 수학적 증명 같은데 동어반복을 하고 있는 것 같기도 하다. 해석학에 있는 많은 증명은 컴퓨터 공부에 나오는 알고리즘(computer algorithm or algorism)처럼 생각하면 쉽다. 컴퓨터는 사람과 같은 직관이 없기 때문에 일일이 알고리즘 관점에서 지시하듯이 프로그램을 작성해야 한다. 그래서, 해석학에 나오는 직관적인 정리를 증명하려면 마치 실제 컴퓨터에게 시킬 일을 지시하듯이 알고리즘 관점에서 적어주면 된다. 다만, 내가 무얼 하고 있는지는 확실히 알고 증명을 써내려 가야 한다.
위의 단조 증감 수렴 정리 증명에도 약점이 있다. 실수의 완비성이 성립하면 최소 상계 혹은 최대 하계(最大下界, infimum or greatest lower bound)가 반드시 존재한다고 했는데 이 값을 어떻게 찾을 수 있을까? 즉, 실수 완비성에 의한 최소 상계 혹은 최대 하계의 존재성도 증명을 해야 한다는 뜻이다.
[그림 3] 수직선에서 보는 데데킨트 절단(출처: wikipedia.org)

이 개념을 이해하기 위해 유명한 식 (3)의 집합(集合, set)을 고려한다.

                                   (3)

집합은 특별한 조건을 가진 대상의 모임이다. 좀 애매한 정의이기는 하지만 매우 유용하기도 하다. 이 집합 개념은 실수를 이해할 때 매우 유용하다.[집합론(set theory)의 출발점도 실수의 이해에 있다. 더 깊이 들어가서 보면 집합론의 시작은 무한 급수 혹은 삼각 함수 급수와 밀접하게 관계되어 있다.] 식 (3)에서 집합 $S$의 상계는 3, 4, 5 등이 될 수 있지만 최소 상계는 $x = \sqrt{2}$이다. 따라서 집합 $S$의 최소 상계는 존재한다. 하지만, 집합 $T$는 다르다. 3, 4, 5가 집합 $T$의 상계가 될 수 있지만 $\sqrt{2}$는 무리수이므로 집합 $T$는 최소 상계가 없다. 식 (3)의 집합을 고려하면 유리수는 완비성에 심각한 문제가 있다. 즉, 유리수(有理數, rational number)는 완비성에 문제가 있으므로 수직선을 완벽히 채울려면 반드시 무리수(無理數, irrational number)가 도입되어야 한다. 이와 같은 개념을 이용하면 [그림 3]에 있는 데데킨트 절단(Dedekind cut)을 이해할 수 있다. 유리수만으로 수직선을 구성하면 [그림 3]과 같이 $x = \sqrt{2}$에서 구멍이 생겨버린다.[∵ $\sqrt{2}$는 유리수가 아니다.]
[그림 4] 유리수가 만드는 극한(출처: wikipedia.org)

유리수는 완비성이 없음을 이해하기 위해 다음 집합을 생각한다.

                                  (4)

집합 $A$, $B$에 있는 부등식은 수직선을 모두 채울 수 있지만 수직선을 구성하는 원소가 유리수에 한정되므로 데데킨트 절단에 의해 항상 $\sqrt{2}$에서 문제가 생긴다. 이를 이해하기 위해 집합 $A$의 원소 $a$를 아래와 같이 구성할 수 있다.[해석학의 증명은 직관에 의지하지 말고 컴퓨터에게 지시하듯이 알고리즘 기반으로 일일이 지시해야 한다.]
  • $a_1 = 1/1$에서 출발해 $a_1 \cdot a_1 < 2$가 되도록 분자를 1씩 증가: $a_1 = 1/1$
  • $a_2 = 10/10$에서 출발해 $a_2 \cdot a_2 < 2$가 되도록 분자를 1씩 증가: $a_2 = 14/10$
  • $a_3 = 140/100$에서 출발해 $a_3 \cdot a_3 < 2$가 되도록 분자를 1씩 증가: $a_3 = 141/100$
  • 이런 시행을 계속 반복
위와 같이 구성하면 유리수 범위에서 $a \cdot a < 2$를 만족하는 $a$가 시행 회수 $n$이 증가함에 따라 이전보다[혹은 $a_{n-1}$보다] 계속 커지도록 구성할 수 있다. 즉, $a_n$은 $n$이 커질수록 최소 상계에 무한히 접근하게 된다. 집합 $B$의 원소 $b$는 $a$를 이용해서 간단하게 구성할 수 있다. 즉, $b = 2/a$로 정의하면 된다. 예를 들면 $b_1 = 2/1$, $b_2 = 20/14$, $b_3 = 200/141$, $\cdots$가 된다. 그런데 문제가 되는 부분은 시행 회수 $n$을 아무리 증가시켜도 $a = b$는 절대 성립하지 않는다.[∵ $\sqrt{2}$가 무리수이기 때문이다.] 다시 말해 [그림 4] 관점으로 보면 파란점빨간점은 유리수 범위에서는 절대 만나지 않는다. 이로 인해 유리수 관점으로 정의한 극한(極限, limit)은 성립하지 않는다. 이런 문제를 명쾌하게 해결한 답이 실수의 완비성이며 실수의 완비성으로 인해 극한을 정확하게 정의할 수 있다. 데데킨트Richard Dedekind(1831–1916)가 이런 개념을 생각해낸 이유도 실수를 명확히 정의해 극한과 나아가서 미분(微分, differentiation)을 명확히 이해하기 위해서이다. 이런 이해를 바탕으로 실수 완비성에 의한 최소 상계 혹은 최대 하계의 존재성을 증명한다. 한가지 명심할 부분은 실수의 완비성은 증명할 수 없는 공리란 사실이다. 유리수의 한계와 데데킨트 절단 개념을 통해 수직선을 완벽히 구성할 수 있는 수 체계를 만들면 바로 실수가 된다. 이 말속에는 실수의 완비성이 자연적으로 들어간다.

[실수 완비성에 의한 최소 상계 혹은 최대 하계의 존재성]
실수의 완비성에 의해 임의의 유한 구간을 가진 실수 집합의 최소 상계 혹은 최대 하계는 반드시 존재한다.

[증명]
먼저 최소 상계부터 증명한다. 어떤 공집합(empty set)이 아닌 유한 구간을 가진 집합을 $S$라고 한다. $S$는 유한 구간을 가졌기 때문에 상계[$S$의 원소보다 항상 큰 구간 바깥에 있는 임의점]를 $B_1$이라 할 수 있다. 구간 안에 있는 임의의 점은 $A_1$이라 한다. 그러면 다음을 통해 최소 상계를 구성할 수 있다.
  • $(A_n+B_n)/2$의 크기를 확인한다.
  • $(A_n+B_n)/2$이 상계라면 $A_{n+1} = A_n$, $B_{n+1} = (A_n+B_n)/2$로 설정
  • $(A_n+B_n)/2$이 상계가 아니라면 $A_{n+1} = (A_n+B_n)/2$, $B_{n+1} = B_n$으로 설정 
이 과정을 반복하면 $A_1 \le A_2 \le \cdots \le B_2 \le B_1$이 되며 $n$을 계속 키워가면 $|A_n - B_n|$의 간격을 한없이 좁혀갈 수 있다. 그런데 유리수와는 다르게 실수는 완비성이 성립하므로 $A_n$과 $B_n$은 같은 극한값에 수렴한다고 할 수 있으며 이 값이 최소 상계가 된다. 최대 하계의 존재성도 동일한 방법으로 증명할 수 있다.
______________________________

위의 증명 방법은 중간값의 정리(中間値의 定理, intermediate value theorem)극값의 정리(極値의 定理, extreme value theorem) 증명에도 이용되었다. 단조 증감 수렴 정리를 적분에 적용하면, 우리 직관과 다른 이상한 경우가 생길 수 있다. 단조 증감 수렴 정리의 또 다른 본질을 이해하기 위해 다음과 같은 유계이면서 단조 증가하는 함수열(function sequence) $f_n(x)$의 정적분 관계를 고려한다.

                  (5)

정적분의 성질에 의해 함수의 부등식 관계는 정적분에서도 그대로 유지된다. 식 (5)와 같은 과정이 무한번 반복되어도 다음처럼 정적분에 대한 단조 증감 수렴 정리가 성립할까?

                  (6)

여기서 $f_n(x)$은 유계이면서 단조 증가하는 함수열이다. 식 (6)을 말로 설명하면, 함수열을 정적분한 값의 극한이 함수열의 극한에 대한 정적분과 같다는 뜻이다. 대부분의 단조 증가 함수열은 식 (6)이 잘 성립한다. 하지만 모든 함수열이 식 (6)을 만족하지는 않는다. 리만 적분(Riemann integral)이 가진 허점 중의 하나가 정적분에 대한 단조 증감 수렴 정리이다. 식 (6)이 성립하지 않는 반례 중 하나는 다음과 같은 디리클레 함수(Dirichlet function) ${\bf 1}_\mathbb{Q}(x)$이다.

                  (7)

[그림 5] 자연수로 유리수 헤아리기(출처: wikipedia.org)

식 (7)에서 유추하여 유계이면서 단조 증가하는 함수열 $f_n(x)$를 구간 $[0, 1]$에서 정의한다.

                  (8)

여기서 $f_1(x) \le f_2 (x) \le < \cdots$, $q_k$[$k$ = $1, 2, \cdots, n$]는 $[0, 1]$ 사이에 있도록 [그림 5]처럼 선택한 $k$번째 유리수이다. 함수열 $f_n(x)$의 $n$을 무한대로 보내면, $\lim_{n \to \infty} f_n (x)$ = ${\bf 1}_\mathbb{Q}(x)$가 된다. 함수열 $f_n(x)$를 리만 적분하기 위해 불연속이 발생한 점 $q_k$를 기준으로 적분 구간을 $n+1$개로 나눈다. 그러면 각 구간의 적분값은 $0$이어서 결국 $\int_0^1 f_n(x) \,dx$ = $0$이다. 하지만 디리클레 함수는 리만 적분이 불가능하므로, 다음처럼 식 (6)이 성립하지 않게 된다.

                  (9)

리만 적분에서는 단조 증감 수렴 정리가 성립하지 않는 경우가 있어서 매우 아쉽다. 그렇다고 식 (6)을 버리기에는 단조 증감 수렴 정리가 너무 강력하다. 이 경우에 대한 해결책이 있을까? 우리가 리만 적분을 확장해서 개선하면 된다. 즉 리만 적분 대신 르베그 적분(Lebesgue integral)을 쓰면, 식 (6)이 성립해서 정적분에도 단조 증감 수렴 정리를 문제없이 사용할 수 있다.

[다음 읽을거리]
1. 무한 급수