지금, 나는 

Art is anything you can get away with.

Math/Calculus

12. 편도함수

hyuckee 2022. 9. 20. 21:47
반응형

다변수함수

이변수함수(function of two variables)
$f$는 집합 $D$의 실수의 각 순서쌍 $(x, y)$에 단 하나의 실수를 대응시키는 규칙으로 $f(x, y)$와 같이 나타낸다. 집합 $D$는 $f$의 정의역(domain)이고 치역(range)은 $f$가 취하는 실수값들의 집합이다. 즉 $\{ f(x, y) | (x, y) \in D \}$이다.

일반적인 점 $(x, y)$에서 $f$에 의해 정해진 값을 명확히 표시하기 위해 종종 $z=f(x, y)$로 쓴다. 변수 $x$와 $y$는 독립변수이고 $z$는 종속변수이다.

$f$가 정의역이 $D$인 이변수함수이면, $f$의 그래프(graph)는 $\mathbb{R}^{3}$에서 $(x, y) \in D$이고 $z=f(x, y)$인 모든 점 $(x, y, z)$의 집합이다.

이러한 그래프는 곡면을 나타낸다.

 

$k$가 ($f$의 치역 안에 있는) 상수일 때 방정식 $f(x, y) = k$를 만족하는 곡선을 이변수함수 $f$의 등위곡선(level curve)이라 한다.

등위곡선들이 서로 인접해 있는 곳의 곡면은 가파르고 멀리 떨어져 있는 곳은 다소 평평하다.

 

삼변수함수(function of three variables) $f$는 정의역 $D \subset \mathbb{R}^{3}$ 안의 각 순서쌍 $(x, y, z)$에 유일한 실수 $f(x, y, z)$를 대응시키는 규칙이다.

삼변수함수의 그래프가 사차원 공간에 있으므로 그래프로 가시화하는 것은 불가능하다. 하지만 등위곡면(level surface)을 조사함으로써 구조를 살펴볼 수 있다.

 

변수의 개수가 늘어날수록 함수를 표기하기 어려워진다. 때로는 함수를 좀더 간단히 나타내기 위해 벡터표기법을 이용해 내적 형태로 표현하기도 한다.


극한과 연속성

$f$를 $(a, b)$에 임의로 가까이 있는 점들을 포함하는 정의역 $D$ 상에서 정의된 이변수함수라 하자. 만일 임의의 양수 $\epsilon > 0$에 대하여, 이에 대응하는 양수 $\delta > 0$가 존재해서
                   $(x, y) \in D$,                $0<\sqrt{(x-a)^{2} + (y-b)^{2}}<\delta$
을 만족하는 $(x, y)$에 대해
                   $|f(x, y)-L|<\epsilon$ 일 때, $\displaystyle\lim_{(x, y)→(a, b)}f(x, y) = L$로 쓰고
$(x, y)$가 $(a, b)$에 접근할 때 $f(x, y)$의 극한값(limit)을 $L$이라고 한다.

즉, 방향(경로)은 극한과 무관하다. 단지, 접근하면서(거리를 충분히 작게 함으로써) 같은 극한을 가지기만 하면 된다.

 

일변수함수와 마찬가지로 이변수함수의 극한의 계산도 극한 법칙을 사용할 수 있다.

이변수함수 $f$가 $(a, b)$에서 '연속이다'라는 것은 $\displaystyle\lim_{(x, y)→(a, b)}f(x, y) = f(a, b)$일 때를 말한다. 만약 $D$가 모든 점 $(a, b)$에서 연속이면 $f$는 $D$ 상에서 연속이다라고 한다.

이변수의 다항식함수(polynomial function of two variables)는 $cx^{m}y^{n}$형태들의 합이다. 유리함수(rational function)는 다항식들의 분수식이다.

 

이 개념들은 셋 이상 변수의 함수로 확장할 수 있다.


편도함수

일반적으로 $f$가 두 변수 $x$와 $y$의 함수이면, $y$를 고정하는 동안, 즉 $y=b$($b$는 상수)로 일정할 때 오직 $x$만 변한다고 가정하자. 그러면 실제로 단지 일변수 $x$만의 함수를 생각할 수 있다.

즉, $g(x)=f(x, b)$. 만일 $g$가 도함수를 가지면, $(a, b)$에서 $x$에 관한 $f$의 편도함수(partial derivative)라고 하고, $f_{x}(a, b)$로 표시한다.

기하학적인 해석은 y=b의 평면에서 자취에 대한 점에서 접선의 기울기이다.

$f_{x}(x, y) = \displaystyle\lim_{h→0}\frac{f(x+h, y) - f(x, y)}{h}$

$f_{y}(x, y) = \displaystyle\lim_{h→0}\frac{f(x, y+h) - f(x, y)}{h}$
편도함수의 표기법       $z = f(x, y)$이면,
$f_{x}(x, y) = f_{x} = \frac{\partial f}{\partial x} = \frac{\partial}{\partial x}f(x, y) = \frac{\partial z}{\partial x} = f_{1} = D_{1}f = D_{x}f$

$f_{y}(x, y) = f_{y} = \frac{\partial f}{\partial y} = \frac{\partial}{\partial y}f(x, y) = \frac{\partial z}{\partial y} = f_{2} = D_{2}f = D_{y}f$

마찬가지로 셋 이상의 변수에 대한 함수에서도 역시 정의된다.

 

$f$가 이변수함수이면 이것의 $f_{x}$와 $f_{y}$ 또한 이변수함수이다. 그리고 그들의 편도함수인 $f$의 2계 편도함수(second partial derivative)를 생각할 수 있다.

$(f_{x})_{x} = f_{xx} = f_{11} = \frac{\partial}{\partial x}\Bigg(\frac{\partial f}{\partial x}\Bigg) = \frac{\partial^{2}f}{\partial x^{2}} = \frac{\partial^{2} z}{\partial x^{2}}$
$(f_{x})_{y} = f_{xy} = f_{12} = \frac{\partial}{\partial y}\Bigg(\frac{\partial f}{\partial x}\Bigg) = \frac{\partial^{2}f}{\partial y \partial x} = \frac{\partial^{2} z}{\partial y \partial x}$
$(f_{y})_{x} = f_{yx} = f_{21} = \frac{\partial}{\partial x}\Bigg(\frac{\partial f}{\partial y}\Bigg) = \frac{\partial^{2}f}{\partial x \partial y} = \frac{\partial^{2} z}{\partial x \partial y}$
$(f_{y})_{y} = f_{yy} = f_{22} = \frac{\partial}{\partial y}\Bigg(\frac{\partial f}{\partial y}\Bigg) = \frac{\partial^{2}f}{\partial y^{2}} = \frac{\partial^{2} z}{\partial y^{2}}$
클레로 정리(Clairaut's Theorem)
$f$를 점 $(a, b)$를 포함하는 원판 $D$에서 정의된 함수라 하자. 만약 함수 $f_{xy}$와 $f_{yx}$가 $D$에서 연속이면 $f_{xy}(a, b) = f_{yx}(a, b)$이다.

3계 이상의 편도함수도 정의될 수 있다.($f_{xyy} = f_{yxy} = f_{yyx}$)


접평면과 선형근사

앞서 편도함수를 구해보았다. 편미분계수는 각각의 평면에서 접선의 기울기였다. 이렇게 생긴 하나의 점에서의 접선들은 평면을 이룬다. 이 평면을 접평면(tangent plane)이라 부른다.

$f$가 연속인 편도함수를 가질 때 점 $P(x_{0}, y_{0}, z_{0})$에서 곡면 $z = f(x, y)$에 대한 접평면의 방정식은 $z-z_{0} = f_{x}(x_{0}, y_{0})(x-x_{0})+f_{y}(x_{0}, y_{0})(y-y_{0})$이다.

그래프가 이 접평면인 1차함수는 $(x_{0}, y_{0})$에서 $f$의 선형화(linearization)라 부르고 근사는 $(x_{0}, y_{0})$에서 $f$의 선형근사(linear approximation) 또는 접평면근사(tangent plane approximation)라 부른다.

 

일변수함수에서 증분을 이용해 미분가능성을 정의했듯 이변수함수의 미분가능성도 다음과 같이 정의할 수 있다.

$z=f(x,y)$일 때, 만약 $\Delta z$가
                     $\Delta z = f_{x}(a,b)\Delta x + f_{y}(a,b)\Delta y + \epsilon_{1}\Delta x + \epsilon_{2}\Delta y$
형으로 표현될 수 있다면 $f$는 $(a, b)$에서 미분가능(differentiable)이다.
단 $(\Delta x, \Delta y) → (0, 0)$일 때 $\epsilon_{1}$과 $\epsilon_{2} → 0$이다.

따라서 만약 $(a, b)$에서 편도함수 $f_{x}$, $f_{y}$가 존재하고 $(a, b)$에서 연속이면, $f$는 $(a, b)$에서 미분가능하다.

 

이변수함수에 대해 미분 또는 전미분(total differential)은 다음과 같이 정의한다.

$dz = f_{x}(x, y)dx + f_{y}(x, y)dy = \frac{\partial z}{\partial x}dx + \frac{\partial z}{\partial y}dy$


연쇄법칙

일변수 이상의 함수에 대한 연쇄법칙은 여러 가지 형태가 있으며 그것들 각각은 합성함수를 미분하는 법칙을 제공한다.

경우 1
$z = f(x, y)$가 $x$와 $y$에 관해 미분가능한 함수라 하고 $x=g(t)$와 $y=h(t)$가 $t$의 미분가능한 함수라 하자.
그러면 $z$는 $t$의 미분가능한 함수이고 $\displaystyle\frac{dz}{dt}=\frac{\partial f}{\partial x}\frac{dx}{dt} + \frac{\partial f}{\partial y}\frac{dy}{dt}$이다.

 

경우 2
$x=g(s, t)$, $y=h(s, t)$가 $s$와 $t$의 미분가능한 함수이고 $z=f(x, y)$는 $x$와 $y$의 미분가능한 함수이면
              $\displaystyle\frac{\partial z}{\partial s} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial s} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial s}$               $\displaystyle\frac{\partial z}{\partial t} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial t} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial t}$
이다.

이를 통해 삼변수 이상의 일반적인 경우에 대해서도 연쇄법칙이 성립한다.

참고로 2계 이상의 편미분은 하나하나 실제로 천천히 계산하는 게 편하다.

 

 

$F(x, y)=0$형의 방정식이 $x$의 미분가능한 함수로써 $y$를 음함수적으로 정의한다고 하자. 즉, $f$의 정의역에 있는 모든 $x$에 대하여 $F(x, f(x))=0$일 때 $y=f(x)$이다. 만약 $F$가 미분가능이면, $x$에 관해 식 $F(x, y)=0$의 양변을 미분하여 $\frac{\partial F}{\partial x}\frac{dx}{dx} + \frac{\partial F}{\partial y}\frac{dy}{dx} = 0$을 얻을 수 있고 다음과 같이 풀 수 있다.

$\displaystyle\frac{dy}{dx} = -\frac{\frac{\partial F}{\partial x}}{\frac{\partial F}{\partial y}} = -\frac{F_{x}}{F_{y}}$


방향도함수와 기울기 벡터

이전의 편도함수는 x축 또는 y축과 평행한 방향에서 z의 변화율을 나타냈다.

이번에는 그걸 확장시켜 임의의 벡터 방향에서의 변화율을 구해보자.

단위벡터 $\mathbf{u} = <a, b>$ 방향에 대한 $(x_{0}, y_{0})$에서 $f$의 방향도함수(directional derivative)는 다음의 극한이 존재할 때
            $D_{u}f(x_{0}, y_{0}) = \displaystyle\lim_{h→0}\frac{f(x_{0}+ha, y_{0}+hb) - f(x_{0}, y_{0})}{h}$이다.

 

따라서 $f$가 $x$와 $y$의 미분가능한 함수이면, $f$는 모든 단위벡터 $\mathbf{u} = <a, b>$ 방향으로의 방향도함수를 갖고 $D_{u}f(x, y) = f_{x}(x, y)a + f_{y}(x, y)b$이다.

 

방향도함수도 두 벡터의 내적으로 쓸 수 있다. 이때, $\mathbf{u}$가 아닌 나머지 벡터는 $f$의 기울기 벡터($f$의 gradient)라는 특별한 이름을 붙이고, grad $f$ 또는 $\nabla f$로 표기하며 'del $f$'라 읽는다.

$f$가 두 변수 $x$와 $y$의 함수이면, $f$의 기울기 벡터는 벡터함수 $\nabla f$이고 다음과 같이 정의된다.
$\nabla f(x, y) = <f_{x}(x, y), f_{y}(x, y)> = \frac{\partial f}{\partial x}\mathbf{i} + \frac{\partial f}{\partial y}\mathbf{j}$

$D_{u}f(x, y) = \nabla f(x, y) \cdot \mathbf{u}$이며 이것은 $\mathbf{u}$ 위에 기울기 벡터를 정사영시킨 것으로 $\mathbf{u}$방향으로의 함수 $f$의 방향도함수를 나타낸다.

 

 

$f$가 이변수 또는 삼변수의 미분가능한 함수라고 하자. 그러면 방향도함수 $D_{u}f(\mathbf{x})$의 최댓값은 $|\nabla f(\mathbf{x})|$이고, 이것은 기울기 벡터 $\nabla f(\mathbf{x})$와 벡터 $\mathbf{u}$의 방향이 일치할 때 나타난다.

내적으로 생각하면 이유를 알 수 있다.

 

등위곡면 상의 임의의 곡선의 접선벡터와 해당 지점에서 접평면의 법선벡터(기울기벡터)는 서로 수직이다.

 

등위곡선에서 기울기 벡터는 다음 등위곡선까지의 가장 빠른 증가 방향을 제공한다.(수직방향으로 움직이면 최대증가치를 얻는다.)


최댓값과 최솟값

$(a, b)$ 근방에 있는 모든 $(x, y)$에 대해 $f(x, y) \le f(a, b)$이면 이변수함수 $f$는 $(a, b)$에서 극대를 갖는다. [이것은 중심이 $(a, b)$인 어떤 원판 내의 모든 점 $(x, y)$에 대해 $f(x, y) \le f(a, b)$를 의미한다.] 값 $f(a, b)$는 극댓값(local maximum value)이라 부른다. 만약 $(a, b)$ 근방에 있는 모든 $(x, y)$에 대해 $f(x, y) \ge f(a, b)$이면, $f$는 $(a, b)$에서 극소를 갖고 $f(a, b)$는 극솟값(local minimum value)이다.

만약 정의역의 모든 점에서 부등식이 성립하면 최대 또는 최솟값을 가진다고 말한다.

 

만약 $f$가 $(a, b)$에서 극값(극대값 또는 극솟값)을 가지며 1계 편도함수가 $(a, b)$에서 존재하면, $f_{x}(a, b) = 0$이고 $f_{y}(a, b) = 0$이다. (즉, $\nabla f(a,b) = \mathbf{0}$)

 

$f_{x}(a, b) = 0$, $f_{y}(a, b) = 0$ 또는 이러한 편도함수들 중 하나가 존재하지 않는 그러한 점 $(a, b)$를 $f$의 임계점(critical point 또는 stationary point)이라 부른다.

 

2차 도함수 판정법
중심 $(a, b)$로 하는 원판에서 $f$의 2계 편도함수가 연속이고 $f_{x}(a, b) = 0$, $f_{y}(a, b) = 0$ [즉, $(a, b)$는 $f$의 임계점]이라 하며
                 $D = D(a, b) = f_{xx}(a,b)f_{yy}(a, b) - [f_{xy}(a, b)]^{2}$이라 하자.

(a) $D>0$이고 $f_{xx}(a, b) > 0$이면, $f(a, b)$는 극솟값이다.
(b) $D>0$이고 $f_{xx}(a, b) < 0$이면, $f(a, b)$는 극댓값이다.
(c) $D<0$이면 $f(a, b)$는 극값이 아니다.

(c) 경우 점 $(a, b)$는 $f$의 안장점(saddle point)이고, $f$의 그래프는 $(a, b)$에서 접평면과 교차한다.

$D$에 관한 공식을 잘 기억하기 위해 행렬식을 쓰면 도움이 된다.

 

이변수함수에 대한 극값 정리
$\mathbb{R}^{2}$상의 유계인 폐집합(경계점 포함함) $D$에서 $f$가 연속이면 $f$가 $D$ 안의 어떤 점 $(x_{1}, y_{1})$과 $(x_{2}, y_{2})$에서 최댓값 $f(x_{1}, y_{1})$과 최솟값 $f(x_{2}, y_{2})$를 갖는다.

하지만 만약 $f$가 $(x_{1}, y_{1})$에서 극값을 가지면 $(x_{1}, y_{1})$은 임계점 또는 $D$의 경계점이다.

그러므로 유계인 폐집합 $D$에서 연속함수 $f$의 최댓값과 최솟값을 구하기 위하여 다음의 절차를 따라야 한다.

1. $D$에서 $f$의 임계점에서 $f$의 값을 구한다.
2. $D$의 경계 위에서 $f$의 값을 구한다.
3. 1과 2로부터 가장 큰 값은 최댓값이고, 가장 작은 값은 최솟값이다.

라그랑주 승수

이전까지 일반적으로 최대, 최소 구하는 법을 알아봤다.

라그랑주 방법은 제약조건을 그래프에 투영시켜서 문제 함수의 교점 중 극값을 찾고 결국 공통접선을 찾는 방법이다.

따라서 접하는 점에서의 법선은 동일하므로 기울기 벡터가 평행함을 이용한다.

 

$\nabla f(x_{0}, y_{0}, z_{0}) = \lambda \nabla g(x_{0}, y_{0}, z_{0})$

이 식에서 수 $\lambda$는 라그랑주 승수(Lagrange multiplier)라 부른다.

라그랑주 승수의 방법
$g(x, y, z) = k$를 제약조건으로 하여 $f(x, y, z)$의 최댓값과 최솟값을 구하기 위하여 [이러한 극값이 존재하고 곡면 $g(x, y, z) = k$상에서 $\nabla g \ne 0$이라 가정하면서]
(a) 다음을 만족하는 모든 $x, y, z, \lambda$의 값을 구한다.
                           $\nabla f(x, y, z) = \lambda \nabla g(x, y, z)$
                                          $g(x, y, z) = k$
(b) 단계 (a)에서 구한 모든 점 $(x, y, z)$에서 $f$의 값을 계산한다. 이 값들 중 가장 큰 것이 $f$의 최댓값이고 가장 작은 것이 $f$의 최솟값이다.

제약조건이 2개($g = k$, $h = c$라면? - 최대, 최소 구하기

제약 조건은 각각의 곡면을 만들게 되고 이를 통해 교차 곡선이 생긴다.

$\nabla f$는 그 점에서 교차 곡선과 수직이다.

$\nabla g$는 $g=k$와 수직이고, $\nabla h$는 $h=c$와 수직이다. 그러므로 $g$와 $h$ 모두 교차곡선에 수직이다. 이것은 세 기울기 벡터 모두 동일한 평면 내에 있다는 것을 의미한다. 따라서 다음의 방정식을 만족한다.

$\nabla f(x_{0}, y_{0}, z{0}) = \lambda \nabla g(x_{0}, y_{0}, z{0}) + \mu \nabla h((x_{0}, y_{0}, z{0})$

728x90

'Math > Calculus' 카테고리의 다른 글

14. 벡터미분적분학  (0) 2022.09.22
13. 다중적분  (0) 2022.09.22
11. 벡터함수  (0) 2022.09.19
10. 벡터와 공간기하학  (0) 2022.09.18
9. 무한수열과 무한급수  (0) 2022.09.17