Monday, April 28, 2014

Dos teoremas básicos que debes comprender de cálculo si quieres hacer investigación aunque creas que "no los vas a usar" (creeme que sí) (Teorema de la función inversa)


Si estás desde un smartphone o tablet, no verás los símbolos bien, por lo que te recomiendo dar click aquí para poder visualizar correctamente este post.

Vamos a explorar hoy 1 de 2 teoremas muy importantes en cálculo/análisis ya más serio a nivel universitario que todo matemático (físico, ingeniero o cualquier científico) debe comprender (y demostrar preferentemente) estos teoremas aparecerán muy frecuentemente en análisis, geometría algebraica, topología algebraica y diferencial, incluso en álgebra también (Teoría de Lie), geometría cuántica y algunas cosas que utilicen geometrías que incluyan de alguna manera a los números reales (como los complejos) por lo que considero (y no sólo yo) son fundamentales.

Hoy veremos el teorema de la función inversa e intentaré dar las herramientas para poder comprenderlo, en el siguiente post veremos el teorema de la función implícita


Este teorema vagamente relaciona directamente la inversa de la derivada de una función vectorial con la derivada de la inversa de esa misma función vectorial, veremos como comprender intuitivamente TODA la construcción de esto, así que empecemos con la derivada en una variable para poder comprender la derivada en varias variables.


Recordemos la derivada usual univariable que hemos visto en posts anteriores para una función $latex f:\mathbb{R} \rightarrow \mathbb{R}$ donde $latex f^{\prime}(a)$ recordemos que era:


$latex f^{\prime} (a):= \lim_{x\to a} \frac{f(x)-f(a)}{x-a}$



Esto existe si y sólo sí :

 $latex \lim_{x\to a} \frac{f(x)-f(a)}{x-a}-f^{\prime}(a)=0$

El cual es equivalente a:



 $latex \lim_{x\to a} \frac{f(x)-f(a)-f^{\prime}(a)(x-a)}{x-a}=0$


y también es equivalente a lo que le da más sentido a funciones $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ :


 $latex \lim_{x\to a} \frac{\mid f(x)-f(a)-f^{\prime}(a)(x-a)\mid}{\mid x-a\mid }=0$




Donde $latex f^{\prime}(a)$ es una matriz de $latex 1\times 1$




Ahora, después de ver la derivada de esta forma, veamos la definición para funciones más en general.


Definición: Una función $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ es diferenciable en $latex a\in \mathbb{R}^n$ si existe una matriz $latex A:\mathbb{R}^n \rightarrow \mathbb{R}^m$ de $latex m\times n$  tal que:


$latex \lim_{x \to a}\frac{\mid f(x)-f(a)-A\cdot (x-a)\mid} {\mid x-a \mid }=0$

Si este $latex a$ existe, denotamos a esta matriz $latex A$ por $latex Df(a)$ que es la derivada de $latex f$ en $latex a$ y le llamamos Jacobiana.


Nota que $latex f(x),f(a)$ y $latex A\cdot (x-a)$ están todos en $latex \mathbb{R}^m$ por lo que:

$latex \mid f(x)-f(a)-A\cdot (x-a)\mid$ es la norma de un vector en $latex \mathbb{R}^m$.

También toma en cuenta que $latex \mid x-a\mid $ es la norma de un vector en $latex \mathbb{R}^n$ .

Aquí podemos ver que $latex Df(a)$ juega el papel de $latex f^{\prime}(a)$ en funciones de $latex \mathbb{R}$ en $latex \mathbb{R}$


La manera más eficiente de calcular esta matriz Jacobiana se puede demostrar con el limite anterior definido y un poco de talacha que está dada por el siguiente teorema.



Teorema 1. Sea $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ dada explícitamente por $latex m$ funciones


$latex f(x_1,...,x_n)=\begin{pmatrix} f_{1}(x_1,...,x_n)\\ \vdots \\ f_{m}(x_1,...,x_m)\end{pmatrix}$


Si las $latex f_i$ son diferenciables entonces la Jacobiana está dada por:


$latex Df(x)=\begin{pmatrix} \frac{\partial f_1}{\partial x_1}&\hdots & \frac{\partial f_1}{x_n}\\ \vdots & \space & \vdots \\ \frac{\partial f_m}{x_1}&\hdots&\frac{\partial f_m}{x_n} \end{pmatrix}$



Es fácil ver que esta matriz cumple la definición de diferenciabilidad para una $latex a\in \mathbb{R}^n$ sustituyéndola en la definición de diferenciabilidad entre funciones vectoriales que mencionamos previamente.
 

Ahora veamos otro teorema importante.


Teorema 2. Sea $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ y Sea $latex g:\mathbb{R}^m \rightarrow \mathbb{R}^l$ diferenciables.

Entonces la composición:


$latex g \circ f:\mathbb{R}^n \rightarrow \mathbb{R}^l$

También es diferenciable y si suponemos que $latex f(a)=b$ su derivada está dada por:


$latex D(g\circ f)(a)=D(g)(b)\cdot D(f)(a)$

Esta regla de la cadena dice que para encontrar la derivada de la composición $latex g\circ f$ se multiplica la Jacobiana de $latex g$ evaluada en b por la Jacobiana de $latex f$ evaluada en $latex a$

La intuición de esto es regresandonos a la derivada en una variable, tenemos que $latex f^{\prime}(a)$ es la pendiente de la linea que pasa tangente a la función $latex y=f(x)$ en el punto $latex (a,f(a))$ en $latex \mathbb{R}^2$.

Si construimos la ecuación de tal tangente tenemos que está dada por.


$latex y=f(a)+f^{\prime}(a)(x-a)$

La cual como ya hemos oído es la "mejor aproximación lineal" a la función $latex f(x)$ cerca de $latex x=a$


Pues aquí un criterio razonable para la derivada de $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ es que sea la mejor aproximación lineal al objeto $latex y=f(x)$ que vive en $latex \mathbb{R}^{n+m}$, pero pues esta es precisamente la definición, la cual construimos intuitivamente en el principio en analogía con el plano $latex \mathbb{R}^2$:

$latex \lim_{x \to a}\frac{\mid f(x)-f(a)-Df(a)\cdot (x-a)\mid} {\mid x-a \mid }=0$

Aquí lo que estamos viendo análogamente con $latex \mathbb{R}^2$ es que $latex y=f(x)$ lo podemos aproximar con la función lineal:


$latex y\approx f(a)+Df(x)\cdot (x-a)$


Ahora veamos el teorema final, ya entendido esto.


Teorema 3 (Teorema de la función inversa): 

Sea $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ continua diferenciable y supón que el $latex Det(Df(a))\neq 0$ para algún punto $latex a\in \mathbb{R}^n$ entonces existe una vecindad abierta de $latex a\in U\subset \mathbb{R}^n$ y una vecindad abierta de $latex f(a)\in V \subset \mathbb{R}^m$ tal que $latex f:U\rightarrow V$ es biyectiva con inversa diferenciable $latex g:V\rightarrow U$

Vamos a analizar este teorema... y esbozar su demostración.


Demostración (informal)

¿Cuándo una función $latex f$ tiene inversa?

Como vimos anteriormente tenemos que la aproximación lineal en $latex x=a$ es: 

$latex f(x)\approx f(a)+Df(x)\cdot (x-a)$


Sabemos por álgebra lineal que $latex Df(a)$ es invertible si y sólo sí $latex Det(Df(a))\neq 0$ , por lo que $latex f(x)$ debería ser invertible (localmente, en su aproximación) si $latex f(a)+Df(a)\cdot (x-a)$ es invertible, lo cual sucede precisamente cuando $latex Det(Df(a))\neq 0$


Considera

$latex y = f(a)+Df(x)\cdot (x-a)$   


Aquí el vector $latex y$ es escrito explícitamente en función del vector variable $latex x$.

Pero si la inversa de $latex Df(a)$ existe , podemos escribir $latex x$ explícitamente en función de $latex y$ , es decir... despejarla para obtener la función inversa multiplicando por la izquierda por la jacobiana inversa y despejando $latex x$ (con cuidado porque la matriz no es necesariamente cuadrada y no es conmutativo el producto de matrices o puede no estar definido), y esto se ve así:


$latex x=a+Df(a)^{-1} \cdot (y-f(a))$

Es decir ya despejamos a $latex x$ en función de $latex y$ utilizando la invertibilidad de la Jacobiana, y observamos que $latex y$ y $latex x$ se ven similares.

Esto se ve claramente sabiendo que invertimos" una ecuación lineal (la mejor aproximación lineal en $latex (a,b=f(a))\in \mathbb{R}^{n+m}$) como $latex x(y)$ es la inversa de $latex y(x)=f(x)$ podemos ver que la derivada de $latex x(y)$ es justamente su pendiente vista como ecuación lineal que es $latex Df(a)^{-1}$ .

Es decir, la derivada de la inversa en $latex f(a)=b$ ($latex x^{\prime}$) es la pendiente de la inversa de la aproximación lineal de $latex f$ en $latex x=a$ que coincide con la jacobiana inversa de $latex f$ en $latex x=a$. 

En otras palabras con esto tenemos que si $latex f^{-1}$ es la inversa de $latex f$ , entonces lo que en símbolos dijimos es precisamente que la derivada de $latex f^{-1}$ es simplemente la inversa de la derivada de la función $latex f$ original.

 de hecho si $latex b=f(a)$ en símbolos esto es que:

$latex Df^{-1}(b)=Df(a)^{-1}$

Esto también se puede demostrar utilizando el teorema 2 sin tanto choro como el que puse que es con la regla de la cadena aplicandola a $latex f^-1 \circ f = I$


Con esto habremos encontrado la función $latex g$ que dice el teorema justo en la aproximación alrededor de $latex a$ y $latex b$ que nos dan las vecindades $latex U $ y $latex V$ del teorema.


Si hay dudas y comentarios


Eduardo Ruíz Duarte (beck)
twitter: @toorandom
















No comments: