지금, 나는 

Art is anything you can get away with.

Math/Calculus

4. 미분의 응용

hyuckee 2022. 9. 9. 16:58
반응형

최대, 최소

보통 최적화 문제에서 미분이 주로 응용된다.

주어진 문제에 대한 최적의 방법을 구하는 것으로, 보통 최댓값 또는 최솟값을 구함으로써 해결 가능하다.

$c$를 함수 $f$의 정의역 $D$에 있는 어떤 수라 하자. 그러면 $f(c)$는
$D$의 모든 $x$에 대해 $f(c) \ge f(x)$를 만족할 때 $D$에서 $f$의 최댓값(absolute maximum value)이라 한다.
반대의 경우는 최솟값(absolute minimum value)이라 한다.

최대, 최소는 종종 대역적(global) 최대, 최소로 부르기도 한다. (정의역 전체에 대한 크기 비교이기 때문)

 

global이 있다면 당연히 local도 있다.

$x$가 $c$ 근방에서 $f(c) \ge f(x)$를 만족할 때 $f(c)$를 함수 $f$의 극댓값(local maximum value)이라 한다.
반대의 경우는 극솟값(local minimum value)이라 한다.

가장 큰 차이는 구간이다. 최대, 최소는 정의역 전체였지만 극대, 극소의 경우 '근방'으로 정의한다.

모호한 표현이지만 간단히 해보자면 임의의 지점 $a$를 기준으로 주변의 점 $a-\epsilon$, $a+\epsilon$에서의 함숫값이 더 크다면 지점 $a$에서 극솟값인 것이다.

이 정의 덕분에 부드러운 곡선이 아닌 첨점에 대해서도 극값을 정의할 수 있다.

극댓값, 극솟값을 모두 통틀어서 극값(extreme values)이라고 한다. 최대, 최소는 극대, 극소에 포함된다고 할 수 있다.

 

다음은 일반적인 함수가 극값을 갖는 것을 보장하는 조건이다.

극값 정리(The Extreme Value Theorem)
$f$가 폐구간 $[a, b]$에서 연속이라면, $f$는 $[a, b]$의 어떤 수 $c$와 $d$에서 최댓값 $f(c)$와 최솟값 $f(d)$를 갖는다.

만약 개구간이라면 잘린(?) 부분에서는 극대, 극소를 정의하기 어렵다. 그 외의 경우, 폐구간으로 삼을 수 있는 부분에서는 극값정리에 의해 불연속함수여도 극값은 물론, 최댓값, 최솟값도 가질 수 있다.

 

페르마 정리(Fermat's Theorem)
$f$가 $c$에서 극댓값이나 극솟값을 갖고 $f'(c)$가 존재하면 $f'(c) = 0$이다.

우선 미분계수가 존재한다면 해당 부분에서 미분가능하며 연속인 것은 자명하다.

극대, 극소의 경우 근방에서 최댓값, 최솟값이다.

생각해보면 그 부분에서 기울기가 음에서 양으로, 양에서 음으로 변한다는 것과 같은 말이다.

극값의 정의를 조작해서 미분계수 형태로 만들어보면 극값에서 기울기가 0이 된다는 것을 알 수 있다.

 

하지만 이 명제의 역은 성립하지 않는다.

예를들어, 어떤 삼차함수의 경우 변곡점에서 미분계수가 0이지만 변곡점은 극값이 아니다.

 

예외가 자꾸 생기면 복잡하다.

그래서 대부분의 경우를 아우를 수 있도록 임계수라는 것을 정의한다.

함수 $f$에서 $f'(c) = 0$이거나 $f'(c)$가 존재하지 않는 $f$의 정의역에 속하는 수 $c$를 함수 $f$의 임계수(critical number)라 한다.

임계수를 해당 함수에서 눈여겨볼만한 부분이라고 생각해도 된다. 특정한 조건을 추가로 만족한다면 우리가 원하던 극값이나 최대, 최소가 될 수도 있기 때문이다.

 

임계수를 정의함으로써 폐구간에서 연속함수의 최댓값 또는 최솟값을 찾기 수월해졌다.

폐구간법(The Closed Interval Method)  폐구간 $[a, b]$의 연속함수 $f$의 최댓값과 최솟값 구하기
1. $(a, b)$ 상에 $f$의 임계수에서 $f$값을 구한다.
2. 구간의 끝점에서 $f$값을 구한다.
3. 위의 1과 2단계로부터 가장 큰 값이 최댓값이고, 가장 작은 값이 최솟값이다.

최대, 최소를 수식으로 바로 구하기에는 이 방법이 유용하다.


미분계수와 관련해 유명한 정리 2가지가 있다.

롤의 정리와 평균값 정리이다. 고등학생 때 이걸 배우면 늘 서로 헷갈렸던 기억이 있다.

롤의 정리(Rolle's Theorem) $f$는 다음 세 가지 가정을 만족하는 함수라고 하자.
1. $f$는 폐구간 $[a, b]$에서 연속이다.
2. $f$는 개구간 $(a, b)$에서 미분가능하다.
3. $f(a) = f(b)$
이때 $f'(c) = 0$을 만족하는 수 $c$가 $(a, b)$ 안에 존재한다.

양 끝의 y좌표가 같다면 최단거리는 직선이고 이때 기울기는 당연히 0이다.

미분가능한 연속인 함수라면 부드러운 곡선도 생각할 수 있고, 시작점부터 끝점까지 어떠한 여정을 떠난다 해도 올라간만큼 내려와야 하고 내려간 만큼 올라와야 한다.

결국 기울기가 0인 지점이 적어도 한 번 생기게 된다.

 

이걸 확장시킨 게 평균값 정리라 봐도 무방하다.

평균값 정리(The Mean Value Theorem) $f$는 다음 가정을 만족하는 함수라고 하자.
1. $f$는 폐구간 $[a, b]$에서 연속이다.
2. $f$는 개구간 $(a, b)$에서 미분가능하다.
이때 다음을 만족하는 수 $c$가 $(a, b)$에 존재한다.
$f'(c) = \frac{f(b) - f(a)}{b - a}$   또는 동치로 $f(b) - f(a) = f'(c)(b - a)$

 

평균값 정리는 범용성이 넓어서 미분의 몇 가지 기본 정리를 증명하는 데에도 쓰인다.

평균값 정리로 증명될 수 있는 상수함수에 대한 다음 정리와 따름 정리가 대표적이다.

구간 $(a, b)$ 안에 모든 $x$에 대해 $f'(x) = 0$이라면 $f$는 $(a, b)$에서 상수함수이다.
따름 정리
구간 $(a, b)$ 안의 모든 $x$에 대해 $f'(x) = g'(x)$라면, $f - g$는 $(a, b)$에서 상수함수이다.
즉 $c$가 상수일 때 $f(x) = g(x) + c$이다.

상수함수에 대한 두 정리는 등식을 증명하는 데에 효과적이다.

 

등식의 한 변을 다른 변에 몰아 한쪽을 0 또는 상수로 만들고 다른 변을 새로운 함수로 정의한다.

이후 이 함수를 미분하면 상수를 미분하는 꼴이기에 풀어보면 당연히 도함수는 0이 된다.

따라서 원시함수를 상수함수로 놓을 수 있게 되고 정의역의 한 지점을 대입했을 때 함숫값이 아까 남겼던 등식의 한 변으로 나온다면 등식은 증명된다.


도함수에는 어떠한 정보가 담겨있을까?

우리가 궁금해하는 $f$는 안 주어지고 도함수를 주는 경우가 생각보다 많다.

따라서 우리는 도함수를 통해 원시함수를 유추해야 할 수 있어야 한다.

 

1차 도함수는 기본적으로 함수의 증가, 감소를 나타낸다.

어떤 구간에서 $f'(x) > 0$이라면 $f$는 증가하고, $f'(x) < 0$이라면 $f$는 감소한다.

 

그리고 앞서 정의했듯이 $f'(c) = 0$이면 $c$는 임계수이다.

이전에 임계수에서 최대, 최소를 찾아봤듯이 극대, 극소를 구별하는 법을 알아보자.

1차 도함수 판정법       $c$가 연속함수 $f$의 임계수라고 하자.
(a) 만일 $f'$이 $c$에서 양수에서 음수로 변한다면, $f$는 $c$에서 극댓값을 갖는다.
(b) 만일 $f'$이 $c$에서 음수에서 양수로 변한다면, $f$는 $c$에서 극솟값을 갖는다.
(c) 만일 $f'$이 $c$에서 부호가 변하지 않는다면 $f$는 $c$에서 극대나 극소를 갖지 않는다.

(a)와 (b)는 어쩌면 당연한 이야기일 수도 있다.

그러나 (c)는 '$f$가 $c$에서 무엇이다'라고 확실히 하기 어렵다.

예를 들어 상수함수일 수도 있고, 어떠한 함수에서는 변곡점일 수도 있다.

상수함수에 대한 극대, 극소, 최대, 최소를 여기서 논하기에는 내용상 맞지 않는 것 같다.

그리고 모든 변곡점이 $f'(c) = 0$인 것만 있지는 않다.


$f$를 $f'$을 통해 유추할 수 있듯, $f'$도 $f''$을 통해 유추할 수 있다.

 

$f'$은 $f$의 미분계수이다. 즉, 순간변화율이자 접선의 기울기라고 할 수 있다.

그렇다면 $f''$은 접선의 기울기의 순간변화율이라 할 수 있다.

 

잠시 곡선에 대해 오목과 볼록을 판단하자. (편의를 위해 '볼록'으로만 표현하겠다)

$f$의 그래프가 구간 $I$상에서 함수의 모든 접선보다 '위'에 존재한다면 이것은 $I$상에서 아래로 볼록(concave upward, CU)이라고 부른다.
$f$의 그래프가 구간 $I$상에서 함수의 모든 접선보다 '아래'에 존재한다면 이것은 $I$상에서 위로 볼록(concave downward, CD)이라고 부른다.

아래로 볼록인 경우, 접선의 기울기는 음수에서 양수로 변한다(증가한다)

위로 볼록인 경우, 반대로 접선의 기울기는 양수에서 음수로 변한다(감소한다)

 

즉, 기울기의 변화율인 2차 도함수로 우리는 함수의 오목, 볼목을 판단할 수 있다.

오목성 판정법
(a) $I$ 상의 모든 $x$에 대하여 $f''(x) > 0$라면, $f$의 그래프는 $I$ 상에서 아래로 볼록하다.
(b) $I$ 상의 모든 $x$에 대하여 $f''(x) < 0$라면, $f$의 그래프는 $I$ 상에서 위로 볼록하다.

그렇다면 오목에서 볼록으로, 볼록에서 오목으로 곡률이 변하는 지점이 있을 것이다.

만약 이 점에서 곡선이 연속이라면, 우리는 그 점을 변곡점(inflection point)이라고 부른다.

즉, 2차 도함수의 부호가 바뀌는 모든 점에서 변곡점이 생긴다.

부호가 바뀌는 것이 포인트다. $f''(c) = 0$이라고 다 변곡점인 것은 아니다.

예를 들어, $g(x) = x|x|$가 (0, 0)에서 변곡점을 가지지만 $g''(0)$이 존재하지 않는다.

또, 변곡점은 2차 도함수의 부호(1차 도함수의 순간변화율)에 영향을 받으므로 1차 도함수의 값 자체와는 관련이 없다.

 

2차 도함수 판정법   $f''$이 $c$ 근방에서 연속이라고 하자.
(a) $f'(c) = 0$이고 $f''(c) > 0$라면, $f$는 $c$에서 극소를 갖는다.
(b) $f'(c) = 0$이고 $f''(c) < 0$라면, $f$는 $c$에서 극대를 갖는다.

1차 도함수 판정법과 실질적으로 같은 내용이다.

하지만 2차 도함수를 구할 수만 있다면 더욱 쉽게 극값을 판정할 수 있다.

 

도함수 판정법이 보통의 경우 만족하지만, 모든 경우를 만족하지는 못한다.

예를 들어, $f(x) = x^{4}\sin\frac{1}{x}$는 0이 임계수이고 도함수의 부호가 0 주변에서 무수히 많이 변화하지만 0에서 극값이 아니다. 

 

그러므로, 판정법은 편리한 도구가 될 수 있으나 맹신할 수는 없다. 따라서 최대한 정의를 이용하는 것이 옳다.


각 도함수에 담긴 정보를 토대로 원시함수의 그래프를 간단히 그릴 수 있다.

다음은 그래프를 그리는 데 확인해야 할 정보이다.

A. 정의역
B. 절편
C. 대칭성(우함수, 기함수, 주기함수)
D. 점근선(수평점근선, 수직점근선, 사선점근선)
E. 증가 또는 감소 구간(1차도함수로 확인)
F. 극댓값과 극솟값(임계수와 판정법 이용)
G. 오목과 변곡점(2차도함수로 확인)

그래프를 그릴 때는 먼저 점근선과 각 점들을 먼저 기입하고 증감과 오목볼록을 생각해서 연결하면 된다.


지금까지 공부한 내용을 바탕으로 우리는 도함수를 이용해서 원시함수의 특징을 파악할 수 있고, 그래프도 대략적으로 그릴 수 있게 되었다.

대부분의 최적화 문제는 수학적인 해석으로 쉽게 결과를 도출할 수 있다.

하지만 함수가 복잡해질수록 우리가 원하는 값(해 또는 근)을 구하기 어렵다.

 

물론 계산기를 이용한 수치적 근찾기 기능이나 컴퓨터 대수시스템을 이용하면 된다.

그런데 수치적 근찾기 기능은 어떻게 작동할까?

원리를 알아야 신뢰하고 제대로 사용할 수 있을테니 한 번 알아보자.

 

대부분 선형근사를 응용하고 다양한 방법이 있지만 주로 뉴턴-랩슨 방법(Newton-Raphson method)을 이용한다.

 

근본적인 원리는 곡선에 대한 접선을 그으면 접선은 x축을 지나게 된다. 이 절편에 해당하는 x좌표에서 또 접선을 긋고 이 행위를 반복하다 보면 곡선의 접점과 x축이 만나 수렴하게 되고 이 좌표가 근이라는 것이다.

 

접선의 방정식을 이용해 다음과 같이 근사해들의 수열을 얻을 수 있다.

n+1번째 근사해 :                         $x_{n+1} = x_{n} - \frac{f(x_{n})}{f'(x_{n})}$

 

대부분의 경우 잘 동작하겠지만 그렇다고 완벽한 건 아니다.

초기 근사해 $x_1$을 잘 선택해야만 수열이 수렴한다.

극값에서 시작하면 진전이 없다.. 그리고 해와 어느정도 가까워야 수렴하는 모양이 나오고 발산하지 않는다.

또, 초기 근사해를 잘못 설정하면 발산해서 정의역 범위를 넘어가는 경우도 있다.

 

심지어 어떤 함수에서는 수열이 발산하거나 진동하는 경우도 있다.

$f(x) = \sqrt[3]{x}$는 정의역 어느 지점에서든 발산한다. 

 

따라서 대부분의 경우 그래핑 도구의 줌 확대를 이용해 근사해를 추정한 다음 뉴턴 방법으로 마무리하는 것이 효율적이다.


부정형과 로피탈

극한 문제를 풀다보면 극한법칙을 적용할 수 없는 부정형 형태를 종종 만난다.

그중 미분계수 형태도 아니고, 이미 아는 극한도 아니며, 식 조작을 통해 부정형을 소거할 수 없는 상황이 도래할 수 있다.

 

이때 특정한 조건을 만족한다면 로피탈 법칙을 통해 쉽게 극한을 구할 수 있다.

로피탈 법칙(L'Hospital's Rule)  $f$와 $g$가 $a$ 근방($a$에서는 제외 가능)에서 미분가능하고 $g'(x) \ne 0$이라고 가정하자.
                         $\displaystyle\lim_{x→a} f(x) = 0$이고          $\displaystyle\lim_{x→a} g(x) = 0$
혹은                  $\displaystyle\lim_{x→a} f(x) = \pm\infty$이고     $\displaystyle\lim_{x→a} g(x) = \pm\infty$
라고 가정하자. (다시 말해서, $\frac{0}{0}$ 또는 $\infty / \infty$인 부정형이다.) 이때 만일 아래 식의 우변의 극한이 존재하면 (또는 이 극한이 $+\infty$ 또는 $-\infty$라면)
                                    $\displaystyle\lim_{x→a}\frac{f(x)}{g(x)} = \displaystyle\lim_{x→a}\frac{f'(x)}{g'(x)}$ 이다.

분자와 분모 각각의 극한값이 동시에 0이거나 무한대이고, 각각 미분가능하며,

도함수 비의 극한이 진동 발산하지 않아야 사용할 수 있는 법칙이다.

(일방향 극한뿐만 아니라 무한으로의 극한에 대해서도 성립한다.)

 

분자, 분모를 개별적인 함수로 두고, 그래프 위의 $x$가 향하는 지점에서 미시적 관점으로 보면

곡선이 아닌 직선처럼 보이게 되며, 이는 접선과 동일하므로 기울기 비를 확인하면 된다는 것이다.


$\frac{0}{0}$꼴이나 $\infty / \infty$꼴은 이제 대부분 풀어낼 수 있다.

따라서 다른 형태의 부정형들은 이 두 형태로 유도하면 다 풀 수 있다.

 

곱 부정형
$0 \cdot \infty$꼴은 한 쪽을 분수꼴로 바꾸면 $\frac{0}{0}$꼴이나 $\infty / \infty$꼴을 얻을 수 있다.
차 부정형
$\infty - \infty$꼴은 공통분모, 유리화 또는 공통인수로 인수분해해서 분수로 변환하면
$\frac{0}{0}$꼴이나 $\infty / \infty$꼴을 얻을 수 있다.
거듭제곱 부정형         $\displaystyle\lim_{x→a} [f(x)]^{g(x)}$에 대하여
1. $\displaystyle\lim_{x→a} f(x) = 0$이고 $\displaystyle\lim_{x→a} g(x) = 0$        $0^{0}$ 형식
2. $\displaystyle\lim_{x→a} f(x) = \infty$이고 $\displaystyle\lim_{x→a} g(x) = 0$        $\infty^{0}$ 형식
3. $\displaystyle\lim_{x→a} f(x) = 1$이고 $\displaystyle\lim_{x→a} g(x) = \pm\infty$        $1^{\infty}$ 형식

거듭제곱 부정형은 각각의 경우에 대해 자연로그를 취하거나 지수함수로 표시하여 $0 \cdot \infty$꼴로 유도해서 풀어야 한다.

1. $y = [f(x)]^{g(x)}$라 하면 $\ln{y} = g(x)\ln{f(x)}$가 된다.
2. $[f(x)]^{g(x)} = e^{g(x)\ln{f(x)}}$가 되게 한다.

 

 

예시로 $\displaystyle\lim_{x→0+}x^{x}$를 구해보자.

 

모든 $x > 0$에 대해 $0^{x} = 0$이지만

모든 $x \ne 0$에 대해 $x^{0} = 1$이므로 이 극한은 부정형이다.

 

$x^{x} = (e^{\ln{x}})^{x} = e^{x\ln{x}}$이고,

로피탈 법칙을 이용하여 $\displaystyle\lim_{x→0+} x\ln{x} = 0$이므로

 

$\displaystyle\lim_{x→0+} x^{x} = \displaystyle\lim_{x→0+} e^{x\ln{x}} = e^{0} = 1$이 된다.

728x90

'Math > Calculus' 카테고리의 다른 글

6. 적분법  (1) 2022.09.11
5. 적분  (0) 2022.09.10
3. 미분법  (2) 2022.09.08
2. 극한과 도함수  (0) 2022.09.07
1. 함수  (0) 2022.09.06