Semana 5 - Espacio tangente y aplicación tangente

Del 11 de septiembre al 15 de septiembre

Tarea semanal 4

Lunes

Recordamos que para el caso de subvariedades \(X = f^{-1}(c)\) que son preimagen de un cierto valor, bajo una sumersión es fácil probar que el núcleo de la diferencial de \(f\) coincide con el conjunto de posibles vectores velocidad de curvas que no «se salen» de \(X\).

Para poder extender esta idea (por lo menos a todas las subvariedades de \(\mathbb R^n\) hacemos uso de la siguiente proposición:

Dado un conjunto \(X\subseteq \mathbb R^n\) las siguientes son equivalentes:

  • \(X\) es una k-subvariedad
  • para todo punto \(p\in X\) existe una función diferenciable \(f: \mathcal U \to \mathbb R^{n-k}\) tal que \(\mathcal U \subseteq \mathbb R^n\) es un abierto y se cumple:
    • \(p \in \mathcal U\)
    • \(X\cap \mathcal U = f^{-1}(0)\)
    • \(D_pf:\mathbb R^n \to \mathbb R^{n-k}\) es suprayectiva.

Si \(X \subseteq \mathbb R^n\) es una subvariedad, \(p\in X\), y gracias a la proposición anterior, podemos afirmar que existe una función que describe localmente a \(X\) como conjunto de nivel, i.e. \(f^{-1}(0) = X\cap \mathcal U\). Si consideramos los posibles vectores velocidad de curvas que pasan por p, tenemos la siguiente igualdad de subespacios vectoriales: \[ \left\{ v\in \mathbb R^n\ \middle\vert \begin{array}{l} \text{ existe } \gamma:(a,b) \to X \\ \text{tal que } \gamma(0) = p \text{ y } \dot\gamma(0) = v \end{array}\right\} = \operatorname{ker}(D_pf) \]

De esta forma, definimos el espacio tangente a \(X\) en \(p\) como dicho espacio: \[ \operatorname{T}_pX \colonequals \operatorname{ker}(D_pf) \]

Se puede probar que dicha definición no depende de la función \(f\) usada.

Si bien esta definición es bastante explícita y manejable, tiene la desventaja de que no sirve en variedades abstractas.

Si \( (M, \mathcal A)\) es una variedadad y \(p\in M\) un punto arbitrario, tiene sentido hablar de curvas diferenciales que pasen por \(p\), sin embargo no existe una noción de «vector velocidad».

Sea \(\gamma:(a,b) \to M\) una curva diferenciable tal que \(\gamma(0)=p\). Podríamos utilizar una carta para «calcular» el vector velocidad de \(\gamma\) en cero, es decir, si \((\mathcal U, \varphi, \mathcal V) \in \mathcal A\) es una carta de \(M\) y consideramos la curva composición \(\varphi \circ \gamma\) esta es una curva en \(\mathbb R^n\) y podemos calcular \(\frac {d \varphi\circ \gamma}{dt}|_0\).

Desafortunadamente dicho vector depende de la carta utilizada.

Martes

Retomando el contexto anterior, si bien el vector velocidad de una curva calculado mediante una carta coordenada no es invariante (es decir, depende de laelección de la carta) una noción que sí es invariante es la de igualdad de vectores velocidad:

Si \(\gamma_1:(a,b)\to M\) y \(\gamma_2:(c,d)\to M\) son dos curvas diferenciales tales que \(\gamma_1(0)= p = \gamma_2(0)\), entonces se cumple que \(\gamma_1\) tiene el mismo vector velocidad que \(\gamma_2\) en cero con respecto a una carta si y solo si tiene el mismo vector con respecto a cualquier otra carta. Más específicamente:

Sean \((\mathcal U_1, \varphi_1, \mathcal V_1)\) \((\mathcal U_2, \varphi_2, \mathcal V_2)\) dos cartas de \(M\) tales que \(p\in \mathcal U_1\cap \mathcal U_2\). entonces se cumple: \[ \begin{aligned} \frac{d \varphi_1\circ\gamma_1}{dt}\Big|_0 &= \frac{d \varphi_1\circ\gamma_2}{dt}\Big|_0 \\ &\Leftrightarrow \\ \frac{d \varphi_1\circ\gamma_1}{dt}\Big|_0 &= \frac{d \varphi_1\circ\gamma_2}{dt}\Big|_0. \end{aligned} \]

Esto nos permite definir una relación de equivalencia en el conjunto de todas las posibles curvas diferenciables que en cero pasan por \(p\):

Definimos \(\gamma_1 \sim \gamma_2\) si y solo si en alguna carta \(\varphi\) (y por lo tanto en todas) se cumple: \[ \frac{d \varphi\circ\gamma_1}{dt}\Big|_0 = \frac{d \varphi\circ\gamma_2}{dt}\Big|_0 \] La idea es que a pesar de que los vectores velocidad de curvas no se pueden calcalcular utilizando cartas (pues dependen de la carta) sí podemos decir cuando dos curvas «representan» el mismo vector tangente.

De esta forma, definimos el espacio tangente (geométrico) a \(M\) en \(p\) como:

\[ \operatorname{T}_pM \colonequals \left\{ [\gamma] ~~ \middle\vert \begin{array}{c} \gamma:(a,b) \to M \\ \text{ es una curva diferenciable y } \\ \gamma(0) = p \end{array}\right\}. \]

Es decir, el espacio tangente es el conjunto de clases de equivalencia de curvas. Notemos que dicho conjunto no posee una estructura de espacio vectorial evidente, será necesario definir una.

Dados dos elementos \([\gamma_1]\) y \([\gamma_2]\) de \(\operatorname{T}_pM\) y un número \(\lambda \in \mathbb R\) definimos un nuevo vector tangente como sigue:

Sea \(\varphi\) una carta de \(M\) centrada1 en \(p\), es decir, tal que \(\varphi(p)=0\).

Las curvas \(\varphi \circ \gamma_1 \) y \(\varphi \circ \gamma_2\) son curvas diferenciables que pasan por el cero en \(\mathbb R^n\), por lo que si definimos: \[ \eta \colonequals \lambda \cdot \varphi \circ \gamma_1 +\varphi \circ \gamma_2 \] obtenemos una curva diferenciable que pasa por cero. Así, posiblemente restringiendo el dominio de \(\eta\) vemos que la curva \(\varphi^{-1}\circ \eta\) es una curva diferenciable que pasa por \(p\). Finalmente definimos \[ \lambda\cdot[\gamma_1] + [\gamma_2] \colonequals [\varphi^{-1}\circ\eta]. \]

Se puede probar que dicha definición dota a \(\operatorname{T}_pM\) de una estructura de espacio vectorial de la misma dimensión que \(M\).

La demostración de este hecho puede resultar complicado si se intenta directamente, por lo que daremos una prueba indirecta, primero relacionando el espacio tangente geométrico con otro espacio vectorial: el espacio tangente algebraico.

Para esto, notemos que si \(v = [\gamma]\in \operatorname{T}_pM\) y \(f:\mathcal U \to \mathbb R\) es una función diferenciable tal que \(p\in \mathcal U\) entonces podemos definir la derivada direccional de \(f\) en la dirección de v: \[ v(f)\colonequals \frac{d \gamma \circ f}{dt}\Big|_0. \]

Es fácil ver que si \(g\) es otra función diferenciable, entonces se cumple:

  • \(v(\lambda\cdot f +g) = \lambda v(f) + v(g)\)
  • \(v(fg) =f(p)v(g) + v(f)g(p)\).

Es decir, \(v\) actua linealmente y cumple una regla de Leibniz. Una propiedad que resultará util, es que \(v\) es un operador local, es decir, \(v(f)\) está determinado por los valores de \(f\) en puntos arbitrariamente cerca de \(p\).

Más formalmente: Si \(f_1:\mathcal U_1 \to \mathbb R\) y \(f_2:\mathcal U_2 \to \mathbb R\) son dos funciones diferenciables y tales que \(p\in \mathcal U_1\cap \mathcal U_2\) y además \(f_1 = f_2\) en una vecindad de \(p\), entonces \(v(f_1) = v(f_2)\).

Miércoles

Para poder formalizar las ideas previas, definmos el siguiente conjunto: \[ C^\infty_p(M) \colonequals \left\{ f ~~ \middle\vert \begin{array}{c} f:\mathcal U \to \mathbb R \\ \text{ es una función diferenciable y } \\ p \in \mathcal U \end{array}\right\}. \] Los elementos de dicho conjunto son funciones diferenciables que están definidas en una vecindad de \(p\). Este conjunto es útil pues frecuentemente no se requieren funciones definidas globlamente2 y basta considerar funciones definidas cerca de \(p\).

Podemos definir operaciones de suma, producto por un escalar, y producto en dicho conjunto. Por ejemplo, si \(f_1:\mathcal U_1\to\mathbb R\) y \(f_2:\mathcal U_2\to\mathbb R\) son dos elementos de \(C^\infty_p(M)\) definimos

\[ f_1 + f_2 \colonequals f_1|_{\mathcal U_1 \cap \mathcal U_2} + f_2|_{\mathcal U_1 \cap \mathcal U_2}. \]

Esta función está definida en \(\mathcal U_1 \cap \mathcal U_2\) que es una vecindad de \(p\).

Las otras operaciones se definen de manera análoga.

Desafortunadamente estas operaciones no cumplen los axxiomas de espacio vectorial3.

Dado un elemento \( v=[\gamma] \in \operatorname T_p(M)\) podemos definir una función \(v: C^\infty_p(M) \to \mathbb R\) como \[ v(f)\colonequals \frac {d} {dt} f\circ\gamma\Big|_0. \] Anteriormente ya vimos que dicha asignación es lineal, satisface una regla de Leibniz y es un operador local.

Motivados por esto definimos:

Una derivación en \(p\) es una función \(\partial: C^\infty_p(M)\to \mathbb R\) que satisface:

  • \(\partial(f + \lambda g) = \partial(f) +\lambda \partial(f)\)
  • \(\partial(fg) = \partial(f)g(p) + f(p)\partial(g)\)
  • \(\partial\) es local, es decir si \(f_1 = f_2\) en una vecindad de \(p\), entonces \(\partial(f_1) = \partial(f_2)\).

Tenemos lo necesario para definir el espacio tangente algebraico: \[ \operatorname T_p^A(M) \colonequals \{\partial | \partial \text{ es una derivación en }p\} \]

Dado que dicho conjunto es un subconjunto del conjunto de todas las funciones de \(C^\infty_p(M)\) en \(\mathbb R\), basta probar que es cerrado bajo suma y producto escalar para probar que es un espacio vectorial.

Por otro lado, ya definimos una manera de asignar una derivación en \(p\) a cada elemento de \(\operatorname T_p(M)\). Más adelante veremos que esta asignación es una biyección que es compatible con la estructura aditiva de \(\operatorname T_p(M)\), por lo que \(T_p(M)\) cumpliría los axiomas de espacio vectorial y la asignación sería un isomorfismo.

Antes de demostrar esto, será necesario estudiar el ejemplo más sencillo de derivaciones: las derivaciones en \(\mathbb R^n\), es decir \(T_0^A(\mathbb R^n)\).

Podemos utilizar las derivadas parciales para definir derivaciones:

si \(f\in C^\infty_p(\mathbb R^n)\) entonces definimos \(\partial_{i}|_0 \) como: \[ \partial_i|_0(f) \colonequals \frac{\partial f}{\partial x_i} \Big|_0. \] Es fácil ver que \(\partial_i|_0\) es una derivación en \(0\).

Más adelante demostraremos que \(\{\partial_i|_0\}_{i=0}^n\) es una base de \(\operatorname T_p^A(\mathbb R^n)\).

Jueves

Para poder mostrar que \(\{\partial_i|_0\}_{i=0}^n\) es una base del espacio de las derivaciones en cero utilizaremos el lema de Hadamard, mismo que enunciamos a continuación:

Lema de Hadamard

Si \(f : \mathcal U \rightarrow \mathbb R\) es una función diferenciable definida en una vacindad estrellada del cero en \(\mathbb R^n\) entonces existen funciones diferenciables \(g_i:\mathcal U \rightarrow \mathbb R \) tales que \[ f(x) = f(0) + \sum_{i=0}^n x^ig_i(x). \] Además se cumple que \(g_i(0) = \frac{\partial f}{\partial x_i}(0)\).

Este lema es similar a una aproximación de Taylor de orden uno, salvo que es una igualdad exacta.

Utilizando este lema podemos demostrar que toda derivación en cero es una combinación lineal de las parciales:

Si \(\partial \in T_0^A\mathbb R^n\) es una derivación arbitraria, y \(f \in C^\infty_0(\mathbb R^n)\) entonces para calcular \(\partial(f)\) usamos el lema de Hadamard y obtenemos: \[ \begin{aligned} \partial(f) &= \partial\left(f(0) + \sum_{i=0}^n x^ig_i\right)\\ &= \partial(f(0)) + \sum_{i=0}^n\partial(x^ig_i)\\ &= \partial(f(0)) + \sum_{i=0}^n\partial(x^i)g_i(0) + x^i(0)\partial(g_i)\\ &= \partial(f(0)) + \sum_{i=0}^n\partial(x^i)\frac{\partial f}{\partial x_i}(0) + 0\partial(g_i)\\ &= \partial(f(0)) + \sum_{i=0}^n\partial(x^i)\frac{\partial f}{\partial x_i}(0) \\ \end{aligned} \]

Ahora bien, \(\partial(f(0))\) es la derivación aplicada a la función constante \(f(0)\), por lo que es igual a \(f(0)\partial(1)\), es decir, basta calcular la derivación aplicada a la función constante \(1\). Usando la regla de Leibniz tenemos \(\partial(1) = \partial(1\cdot1)=\partial(1)1(0) + 1(0)\partial(1) = 2\partial(1)\). Con lo que podemos conlcuir que \(\partial(1) = 0\). Esto prueba que cualquier derivación se anula en las funciones constantes.

Finalmente denotamos por \(a^i \colonequals \partial(x^i)\) a la derivación aplicada a la i-ésima función coordenada, tenemos los coeficientes buscados y concluimos:

\[ \begin{aligned} \partial(f) &= \\ &= \sum_{i=0}^na^i\frac{\partial f}{\partial x_i}(0)\\ &=\left(\sum_{i=0}^na^i\partial_i\right)(f) \end{aligned} \] Es decir \(\partial = \sum a^i\partial_i\) como se quería demostrar.

Viendo que las parciales son una base del tangente algebraico podemos concluir que éste es un espacio vectorial de dimensión \(n\) y que la transformación: \[ \begin{aligned} \mathbb R^n &\to T_0^A\mathbb R^n\\ (a^1, \ldots, a^n) &\mapsto \sum a^i\partial_i \end{aligned} \] es un isomorfismo.

Ahora que para cualquier punto en cualquier variedad hemos definido dos espacios tangentes, sería deseable encontrar una forma natural de relacionarlos:

Dado un elemento \([\gamma] \in T_p^GX\) del tangente geométrico, podemos definir una derivación \(\operatorname{der}_p([\gamma])\) en \(p\) como sigue: dada una función \(f\in C^\infty_p(X)\) definimos \[ \operatorname{der}_p ([\gamma])(f) \colonequals \frac{d f\circ\gamma}{dt}\Big|_0 \] De esta forma definimos una función \(\operatorname{der}_p: T_p^G X \to T_p^AX\).

La aplicación tangente

En \(\mathbb R^n\), los vectores velocidad de curvas diferenciables se transforman bajo aplicaciones diferenciables de acuerdo a la diferenciales de la aplicación. Dicho de otra forma, podemos pensar que la diferencial de una función diferenciable «actua» en los vectores velocidad de curvas.

Dado que el espacio tangente geométrico está definido tratando de imitar la idea de los «vectores velocida de curvas» no es de extrañarse que cada vez que tengamos una función diferenciable entre variedades, esta induzca una función entre los espacios tangentes correspondientes. Más aún, esta función es el análogo en variedades de la diferencial de una función en \(\mathbb R^n\).

Sea \(\varphi : X \rightarrow Y\) una función diferenciable y sean \(p\in X\) y \(q=\varphi(p)\) puntos en \(X\) y \(Y\) respectivamente.

Definimos la aplicación tangente a \(\varphi\)4 en \(p\) como sigue:

\[ \begin{aligned} T^G_p\varphi: T^G_pX &\to T^G_qY \\ [\gamma] &\mapsto [\varphi\circ \gamma] \end{aligned} \] También es posible definir la aplicación tangente utilizando la versión algebriaca del espacio tangente: \[ \begin{aligned} T^A_p\varphi: T^A_pX &\to T^A_qY \\ \partial &\mapsto \left[ f\mapsto \partial(f\circ \varphi) \right] \end{aligned} \] es decir, dada una derivación \(\partial\in T^A_pX\), la derivación \(T^A_p\varphi(\partial)\) evaluada en una función \(f\in C^\infty_q(Y)\) es: \[ T^A_p\varphi(\partial)(f) \colonequals \partial(f\circ \varphi) \] No es dificil verificar que esto efectivamente define una derivación en \(q\) y que además \(T^A_p\varphi\) es una función lineal.

Véase también

1

Dichas cartas siempre existen: a partir de una carta arbitraria, componiendo con una traslación adecuada se puede garantizar que la imagen de \(p\) es cero.

2

Es decir, definidas en toda la variedad.

3

Por ejemplo, existen muchos elementos que cumplen \(f + f = f\) y en un espacio vectorial el único elemento que cumple esta ecuación es el neutro aditivo.

4

A esta aplicación también le llamaremos la derivada o la diferencial de \(\varphi\).