Forma cuadrática

Una forma cuadrática o forma bilineal simétrica es una aplicación matemática que asigna a cada elemento x {\displaystyle x} de un espacio vectorial un elemento del cuerpo sobre el que está construido el espacio vectorial, de una manera que generaliza la operación a x 2 {\displaystyle ax^{2}} un espacio vectorial de dimensión superior a 1.

Definición formal

Una forma cuadrática es una aplicación ω {\displaystyle \omega \,} del espacio vectorial E {\displaystyle E} en el cuerpo K {\displaystyle \mathbb {K} } , que cumple las siguientes condiciones equivalentes:

a) Existe una forma bilineal simétrica f ( , ) {\displaystyle f(\cdot ,\cdot )} de E × E {\displaystyle E\times E} en el cuerpo K {\displaystyle \mathbb {K} } tal que ω ( x ) = f ( x , x ) {\displaystyle \omega (x)=f(x,x)} . A f ( , ) {\displaystyle f(\cdot ,\cdot )} se le llama forma polar de ω {\displaystyle \omega } .
b) ω ( l x ) = l 2 ω ( x ) {\displaystyle \omega (lx)=l^{2}\omega (x)} , l K , x E {\displaystyle \forall l\in K,\forall x\in E} . Además f ( x , y ) = ω ( x + y ) ω ( x ) ω ( y ) 2 {\displaystyle f(x,y)={\frac {\omega (x+y)-\omega (x)-\omega (y)}{2}}} es una forma bilineal simétrica definida en E × E {\displaystyle E\times E} y con valores en K {\displaystyle \mathbb {K} } . A ω {\displaystyle \omega } se le llama forma cuadrática asociada a f ( , ) {\displaystyle f(\cdot ,\cdot )} .

Prefijada una base u = ( u 1 , , u n ) {\displaystyle u=(u_{1},\dots ,u_{n})} del espacio E {\displaystyle E} , una forma cuadrática es por tanto una aplicación de la forma f ( x , x ) = X T B   X {\displaystyle f(x,x)=X^{\mathsf {T}}\,B\ X} , donde X {\displaystyle X} son las coordenadas de x {\displaystyle x} en base u {\displaystyle u} y B {\displaystyle B} es una matriz (la matriz de f {\displaystyle f} en base u {\displaystyle u} ) que tiene la forma siguiente ( ω {\displaystyle \omega } es la forma bilineal simétrica asociada a f {\displaystyle f} ):

( ω ( u 1 , u 1 ) ω ( u 1 , u 2 ) ω ( u 1 , u n ) ω ( u 2 , u 1 ) ω ( u 2 , u 2 ) ω ( u 2 , u n ) ω ( u n , u 1 ) ω ( u n , u 2 ) ω ( u n , u n ) ) {\displaystyle {\begin{pmatrix}\omega (u_{1},u_{1})&&\omega (u_{1},u_{2})&&\cdots &&\omega (u_{1},u_{n})\\\omega (u_{2},u_{1})&&\omega (u_{2},u_{2})&&\cdots &&\omega (u_{2},u_{n})\\\vdots &&\vdots &&\ddots &&\vdots \\\omega (u_{n},u_{1})&&\omega (u_{n},u_{2})&&\dots &&\omega (u_{n},u_{n})\end{pmatrix}}}

Se suele escribir B =: M u ( f ) {\displaystyle B=:M_{u}(f)} .

Habitualmente también que se representan mediante un polinomio de segundo grado con varias variables (tantas como la dimensión del espacio vectorial), que se obtiene desarrollando el producto f ( x , x ) = X T B   X {\displaystyle f(x,x)=X^{\mathsf {T}}\,B\ X} (habiendo fijado previamente una base).

Es decir, fijada una base, hay una biyección entre formas cuadráticas de E {\displaystyle E} con dim E = n {\displaystyle \dim E=n} , matrices simétricas n × n {\displaystyle n\times n} y polinomios de segundo grado en n {\displaystyle n} variables.

Equivalencia entre formas cuadráticas y formas bilineales simétricas

Es evidente que tanto las formas cuadráticas como las formas bilineales simétricas definen sendos espacios vectoriales (son estables bajo combinaciones lineales con elementos del cuerpo). Para ver la equivalencia entre las formas cuadráticas y las formas bilineales simétricas, basta encontrar una biyección entre estos dos espacios vectoriales, que no es sino el contenido del apartado b) de la sección anterior. Sin embargo, no han de confundirse: las formas bilineales son aplicaciones de E × E K {\displaystyle E\times E\to \mathbb {K} } mientras que las formas cuadráticas son aplicaciones de E K {\displaystyle E\to \mathbb {K} } .

Equivalencia de formas cuadráticas

Se dice que dos formas cuadráticas q φ , q ψ {\displaystyle q_{\varphi },q_{\psi }} (con formas bilineales asociadas φ , ψ {\displaystyle \varphi ,\psi } , respectivamente) son equivalentes si existen bases e , u {\displaystyle e,u} del espacio vectorial E {\displaystyle E} tales que q φ , q ψ {\displaystyle q_{\varphi },q_{\psi }} tienen la misma matriz, es decir, q φ q ψ u , e {\displaystyle q_{\varphi }\sim q_{\psi }\Leftrightarrow \exists u,e} bases de E {\displaystyle E} tales que M e ( q φ ) = M u ( q ψ ) {\displaystyle M_{e}(q_{\varphi })=M_{u}(q_{\psi })} . Esto es claramente una relación de equivalencia y nos permitirá clasificar las formas cuadráticas. El resultado principal de esta sección es que toda forma cuadrática de un espacio vectorial sobre un cuerpo de característica distinta de 2 es equivalente a una forma con matriz diagonal.

Lo primero que necesitamos es ver cómo se comportan las matrices asociadas respecto del cambio de base. Si e , u {\displaystyle e,u} son dos bases de E {\displaystyle E} , M u , e {\displaystyle M_{u,e}} es la matriz del cambio de u {\displaystyle u} a e {\displaystyle e} (es decir, sus columnas son las componentes de los vectores de u {\displaystyle u} en base e {\displaystyle e} ) y q {\displaystyle q} es una forma cuadrática, entonces M u ( q ) = M u , e T M e ( q ) M u , e {\displaystyle M_{u}(q)=M_{u,e}^{\mathsf {T}}M_{e}(q)M_{u,e}} .

Demostración
Sea x E {\displaystyle x\in E} y sean X e , X u {\displaystyle X_{e},X_{u}} los vectores de sus coordenadas en bases e , u {\displaystyle e,u} , respectivamente. Pero las coordenadas en base e {\displaystyle e} de x {\displaystyle x} vienen dadas por el vector X e = M u , e X u {\displaystyle X_{e}=M_{u,e}X_{u}} . Ahora,

q ( x , x ) = X e T M e ( q ) X e = ( M u , e X u ) T M e ( q ) ( M u , e X u ) = X u T ( M u , e T M e ( q ) M u , e ) X u {\displaystyle q(x,x)=X_{e}^{\mathsf {T}}M_{e}(q)X_{e}=(M_{u,e}X_{u})^{\mathsf {T}}M_{e}(q)(M_{u,e}X_{u})=X_{u}^{\mathsf {T}}(M_{u,e}^{\mathsf {T}}M_{e}(q)M_{u,e})X_{u}}

Como M u ( q ) {\displaystyle M_{u}(q)} es, por definición, la (única) matriz tal que q ( x , x ) = X u T M u ( q ) X u {\displaystyle q(x,x)=X_{u}^{\mathsf {T}}M_{u}(q)X_{u}} , tenemos la relación que buscábamos. {\displaystyle \quad \square }

Veamos ahora el resultado principal: toda forma cuadrática q φ {\displaystyle q_{\varphi }} de un espacio vectorial sobre un cuerpo de característica distinta de 2 es equivalente a una forma con matriz diagonal, es decir, hay una base u {\displaystyle u} tal que φ ( u i , u j ) = 0       i j {\displaystyle \varphi (u_{i},u_{j})=0\ \ \ \forall i\neq j} . Esto quiere decir, además, que el polinomio asociado a q φ {\displaystyle q_{\varphi }} en base u {\displaystyle u} es una suma de cuadrados: q ( x ) = a 1 x 1 2 + + a n x n 2 {\displaystyle q(x)=a_{1}x_{1}^{2}+\dots +a_{n}x_{n}^{2}} ( ( x 1 , , x n ) T {\displaystyle (x_{1},\dots ,x_{n})^{\mathsf {T}}} son las coordenadas de x {\displaystyle x} en base u {\displaystyle u} ). Tal base se suele denominar φ {\displaystyle \varphi } -ortogonal por analogía a cuando φ {\displaystyle \varphi } es un producto escalar.

Toda forma cuadrática q φ {\displaystyle q_{\varphi }} de un espacio vectorial de característica distinta de dos admite una base φ {\displaystyle \varphi } -ortogonal.
Sea q φ {\displaystyle q_{\varphi }} una forma cuadrática con forma bilineal simétrica asociada φ {\displaystyle \varphi } . Hacemos la demostración por inducción sobre la dimensión del espacio vectorial, n = dim E {\displaystyle n=\dim E} .

n = 1 {\displaystyle n=1} : En este caso, la matriz de la forma cuadrática es 1 × 1 {\displaystyle 1\times 1} , por lo que ya es diagonal, así que no hay nada que demostrar.

Supongamos el resultado cierto para n 1 {\displaystyle n-1} y veámoslo para n > 1 {\displaystyle n>1} .

Si φ = 0 {\displaystyle \varphi =0} , entonces, M e ( q φ ) = 0 {\displaystyle M_{e}(q_{\varphi })=0} en cualquier base y, en particular, es diagonal.

Podemos suponer pues que φ 0 {\displaystyle \varphi \neq 0} y, en particular, que q φ 0 {\displaystyle q_{\varphi }\neq 0} . Por tanto, existe un vector u 1 E {\displaystyle u_{1}\in E} tal que q φ ( u 1 ) 0 {\displaystyle q_{\varphi }(u_{1})\neq 0} . Además, la aplicación φ ( u 1 , ) : E K {\displaystyle \varphi (u_{1},\cdot )\colon E\rightarrow \mathbb {K} } es no nula (es distinta de cero en u 1 {\displaystyle u_{1}} ), lineal y su núcleo Ker ( φ ( u 1 , ) ) {\displaystyle \operatorname {Ker} (\varphi (u_{1},\cdot ))} tiene dimensión n dim ( Im φ ( u 1 , ) ) = n 1 {\displaystyle n-\dim(\operatorname {Im} \varphi (u_{1},\cdot ))=n-1} por el teorema rango-nulidad.

Como u 1 Ker ( φ ( u 1 , ) ) {\displaystyle u_{1}\not \in \operatorname {Ker} (\varphi (u_{1},\cdot ))} , tenemos que u 1 Ker ( φ ( u 1 , ) ) = { 0 } {\displaystyle \langle u_{1}\rangle \cap \operatorname {Ker} (\varphi (u_{1},\cdot ))=\{0\}} , por lo que E = u 1 Ker ( φ ( u 1 , ) ) {\displaystyle E=\langle u_{1}\rangle \oplus \operatorname {Ker} (\varphi (u_{1},\cdot ))} (están en suma directa).

Sea ψ {\displaystyle \psi } la restricción de φ {\displaystyle \varphi } a Ker ( φ ( u 1 , ) ) {\displaystyle \operatorname {Ker} (\varphi (u_{1},\cdot ))} . Como este último espacio tiene dimensión n 1 {\displaystyle n-1} , ψ {\displaystyle \psi } tiene una base ψ {\displaystyle \psi } -ortogonal ( u 2 , , u n ) {\displaystyle (u_{2},\dots ,u_{n})} .

Ahora, la base ( u 1 , , u n ) {\displaystyle (u_{1},\dots ,u_{n})} de E {\displaystyle E} es φ {\displaystyle \varphi } -ortogonal, pues la primera fila y la primera columna son nulas excepto en el elemento diagonal por definición de Ker ( φ ( u 1 , ) ) {\displaystyle \operatorname {Ker} (\varphi (u_{1},\cdot ))} y el resto por ser ( u 2 , , u n ) {\displaystyle (u_{2},\dots ,u_{n})} ψ {\displaystyle \psi } -ortogonal. {\displaystyle \quad \square }

Clasificación en el caso complejo

Supongamos a partir de ahora que K = C {\displaystyle \mathbb {K} =\mathbb {C} } y veamos qué más podemos deducir. Nuestro objetivo es describir exactamente las clases de equivalencia y dar un representante canónico de cada una. Es decir, queremos dar una lista de formas cuadráticas (o matrices simétricas, ya que están en biyección) tal que cualquier otra forma sea equivalente a una y sólo una de las formas de esa lista.

Ya hemos visto que toda forma es equivalente a una forma con matriz diagonal, pero vamos a demostrar más en el caso complejo: dada una forma q φ : E C {\displaystyle q_{\varphi }\colon E\rightarrow \mathbb {C} } , existe una base u = ( u 1 , , u n ) {\displaystyle u=(u_{1},\dots ,u_{n})} de E {\displaystyle E} tal que la matriz de q φ {\displaystyle q_{\varphi }} en base u {\displaystyle u} es de la forma siguiente para un cierto r = 0 , , n {\displaystyle r=0,\dots ,n} , con n = dim E {\displaystyle n=\dim E} :

( 1 r 1 0 0 ) {\displaystyle {\begin{pmatrix}1&\\&\ddots ^{r}\\&&1\\&&&0\\&&&&\ddots &\\&&&&&0\end{pmatrix}}}

Demostración
Sea u = ( u 1 , , u n ) {\displaystyle u=(u_{1},\dots ,u_{n})} la base de E {\displaystyle E} en que q φ {\displaystyle q_{\varphi }} tiene matriz simétrica. Podemos suponer (reordenando la base) que los elementos nulos de la matriz están abajo. Es decir, que M u ( q φ ) = D ( a 1 , , a r , 0 , , 0 ) ,     a i 0 , i = 1 , , r {\displaystyle M_{u}(q_{\varphi })=D(a_{1},\dots ,a_{r},0,\dots ,0),\ \ a_{i}\neq 0,i=1,\dots ,r} , con r = 0 , , n {\displaystyle r=0,\dots ,n} .

Ahora, podemos definir la base v = ( v 1 , , v n ) = ( 1 a 1 u 1 , , 1 a r u r , u r + 1 , , u n ) {\displaystyle v=(v_{1},\dots ,v_{n})=\left({\tfrac {1}{\sqrt {a_{1}}}}u_{1},\dots ,{\tfrac {1}{\sqrt {a_{r}}}}u_{r},u_{r+1},\dots ,u_{n}\right)} . Podemos tomar raíces sin preocuparnos por el signo porque el cuerpo es C {\displaystyle \mathbb {C} } . Es un cálculo sencillo comprobar que en la nueva base la matriz tiene la forma que queremos. {\displaystyle \quad \square }

Ahora afirmamos que toda forma cuadrática compleja es equivalente a una y sólo una forma cuadrática de la forma anterior, con r = 0 , , n {\displaystyle r=0,\dots ,n} . En efecto, que es equivalente a una ya lo hemos demostrado; veamos que lo es a sólo una. Definimos el rango de una cuádrica rg ( q φ ) {\displaystyle \operatorname {rg} (q_{\varphi })} como el rango de su matriz en una cierta base. Está bien definido porque su matriz en otra base se obtiene multiplicando la matriz en la base original por matrices de cambio de base (invertibles), por lo que su rango no cambia. Esto quiere decir que D ( 1 , r ) , 1 , 0 , , 0 ) {\displaystyle D(1,{\overset {r)}{\dots }},1,0,\dots ,0)} y D ( 1 , s ) , 1 , 0 , , 0 ) {\displaystyle D(1,{\overset {s)}{\dots }},1,0,\dots ,0)} no son equivalentes para r s {\displaystyle r\neq s} (pues tienen rangos distintos), de donde una forma cuadrática arbitraria q φ {\displaystyle q_{\varphi }} sólo puede ser equivalente a una de las anteriores.

En conclusión, en un espacio de dimensión n {\displaystyle n} hay n + 1 {\displaystyle n+1} clases de equivalencia de formas cuadráticas complejas; se puede tomar como representante canónico de cada clase la matriz diagonal con r {\displaystyle r} unos en la diagonal ( r = 0 , , n {\displaystyle r=0,\dots ,n} ), y podemos saber a qué clase pertenece una forma cuadrática compleja dada simplemente mirando el rango de su matriz en cualquier base (este rango es el número r {\displaystyle r} de unos en la diagonal del representante canónico de su clase).

Clasificación en el caso real

En este último apartado suponemos que K = R {\displaystyle \mathbb {K} =\mathbb {R} } y queremos hacer lo mismo que hemos hecho para los complejos, es decir, encontrar una lista de formas cuadráticas reales tal que cualquier otra sea equivalente a una y sólo una de la lista.

Como antes, ya hemos visto que toda forma es equivalente a una forma con matriz diagonal. En el caso complejo podíamos transformar todos los elementos diagonales en 1 porque podíamos tomar raíces de los elementos diagonales fueran positivos o negativos (ver la demostración en el apartado anterior). Sin embargo, en el caso real esto último no lo podemos hacer para elementos negativos y veremos que lo máximo que podemos hacer es transformar los coeficientes negativos en -1 (y los positivos en 1, como en el caso complejo).

Es decir, afirmamos que dada una forma cuadrática q φ : E R {\displaystyle q_{\varphi }\colon E\rightarrow \mathbb {R} } , existe una base u = ( u 1 , , u n ) {\displaystyle u=(u_{1},\dots ,u_{n})} de E {\displaystyle E} tal que la matriz de q φ {\displaystyle q_{\varphi }} en base u {\displaystyle u} es de la forma siguiente para ciertos i + , i = 0 , , n , i + + i n {\displaystyle i_{+},i_{-}=0,\dots ,n,\quad i_{+}+i_{-}\leq n} :

( 1 i + 1 1 i 1 0 0 ) {\displaystyle {\begin{pmatrix}1&\\&\ddots ^{i_{+}}\\&&1\\&&&-1\\&&&&\ddots ^{i_{-}}&\\&&&&&-1\\&&&&&&0\\&&&&&&&\ddots \\&&&&&&&&0\end{pmatrix}}}

Demostración
Sea B = ( u 1 , , u i + , v 1 , , v i , w 1 , , w i 0 ) {\displaystyle B=(u_{1},\dots ,u_{i_{+}},v_{1},\dots ,v_{i_{-}},w_{1},\dots ,w_{i_{0}})} la base de E {\displaystyle E} en que q φ {\displaystyle q_{\varphi }} tiene matriz simétrica. Podemos suponer (reordenando la base) que los elementos diagonales están colocados en la diagonal en el orden siguiente: primero los positivos, luego los negativos y luego los nulos (por eso la notación de los subíndices). Es decir, que M B ( q φ ) = D ( a 1 , , a i + , b 1 , , b i , 0 , , 0 ) ,     a i > 0 , i = 1 , , i + , b i < 0 , i = 1 , i {\displaystyle M_{B}(q_{\varphi })=D(a_{1},\dots ,a_{i_{+}},b_{1},\dots ,b_{i_{-}},0,\dots ,0),\ \ a_{i}>0,i=1,\dots ,i_{+},\quad b_{i}<0,i=1,\dots i_{-}} .

Ahora, podemos definir la base ( 1 a 1 u 1 , , 1 a i + u i + , 1 b 1 v 1 , , 1 b i v i , w 1 , , w i 0 ) {\displaystyle \left({\tfrac {1}{\sqrt {a_{1}}}}u_{1},\dots ,{\tfrac {1}{\sqrt {a_{i_{+}}}}}u_{i_{+}},{\tfrac {1}{\sqrt {-b_{1}}}}v_{1},\dots ,{\tfrac {1}{\sqrt {-b_{i_{-}}}}}v_{i_{-}},w_{1},\dots ,w_{i_{0}}\right)} . Es un cálculo sencillo comprobar que en la nueva base la matriz tiene la forma que queremos. {\displaystyle \quad \square }

De hecho, afirmamos que esta es toda la clasificación, es decir, que cualquier forma cuadrática real es equivalente a una y sólo una de las formas anteriores para ciertos i + , i = 0 , , n , i + + i n {\displaystyle i_{+},i_{-}=0,\dots ,n,\quad i_{+}+i_{-}\leq n} . Que es equivalente a una ya lo hemos visto; veamos que sólo lo es a una demostrando que las formas anteriores no son equivalentes entre sí. Para ver esto tomamos q φ {\displaystyle q_{\varphi }} una forma cuadrática real y u {\displaystyle u} una base φ {\displaystyle \varphi } -ortogonal (la matriz M u ( q φ ) {\displaystyle M_{u}(q_{\varphi })} es diagonal) y definimos:

F + ( u ) = u i : q φ ( u i ) > 0 i + ( u ) = dim F + ( u ) {\displaystyle F_{+}(u)=\langle u_{i}:q_{\varphi }(u_{i})>0\rangle \quad \quad \quad i_{+}(u)=\dim F_{+}(u)}

F ( u ) = u i : q φ ( u i ) < 0 i ( u ) = dim F ( u ) {\displaystyle F_{-}(u)=\langle u_{i}:q_{\varphi }(u_{i})<0\rangle \quad \quad \quad i_{-}(u)=\dim F_{-}(u)}

F 0 ( u ) = u i : q φ ( u i ) = 0 i 0 ( u ) = dim F 0 ( u ) {\displaystyle F_{0}(u)=\langle u_{i}:q_{\varphi }(u_{i})=0\rangle \quad \quad \quad i_{0}(u)=\dim F_{0}(u)}

Vamos a demostrar que i + ( u ) , i ( u ) , i 0 ( u ) {\displaystyle i_{+}(u),i_{-}(u),i_{0}(u)} son independientes de la base φ {\displaystyle \varphi } -ortogonal escogida. Por tanto, las matrices anteriores, como tienen estos números distintos, no son equivalentes, y habremos completado la clasificación.

Si u , v {\displaystyle u,v} son dos bases φ {\displaystyle \varphi } -ortogonales, entonces i + ( u ) = i + ( v ) ,   i ( u ) = i ( v ) ,   i 0 ( u ) = i 0 ( v ) {\displaystyle i_{+}(u)=i_{+}(v),\ i_{-}(u)=i_{-}(v),\ i_{0}(u)=i_{0}(v)} .
Claramente i 0 ( u ) = n rg ( M u ( q φ ) ) = n rg ( q φ ) {\displaystyle i_{0}(u)=n-\operatorname {rg} (M_{u}(q_{\varphi }))=n-\operatorname {rg} (q_{\varphi })} es independiente de la base escogida (ya vimos en el apartado de la clasificación compleja que el rango sólo dependía de la forma cuadrática y no de la base).

Veamos los otros. Claramente E = F + ( u ) F ( u ) F 0 ( u ) = F + ( v ) F ( v ) F 0 ( v ) {\displaystyle E=F_{+}(u)\oplus F_{-}(u)\oplus F_{0}(u)=F_{+}(v)\oplus F_{-}(v)\oplus F_{0}(v)} , donde {\displaystyle \oplus } denota la suma directa (pues u , v {\displaystyle u,v} son bases).

Consideremos la aplicación siguiente:

f = π i : F + ( u ) i E π F + ( v ) {\displaystyle f=\pi \circ i\colon F_{+}(u){\overset {i}{\longrightarrow }}E{\overset {\pi }{\longrightarrow }}F_{+}(v)} ,

con i {\displaystyle i} la inclusión de F + ( u ) {\displaystyle F_{+}(u)} en E {\displaystyle E} y π {\displaystyle \pi } la proyección de E = F + ( v ) ( F ( v ) F 0 ( v ) ) {\displaystyle E=F_{+}(v)\oplus (F_{-}(v)\oplus F_{0}(v))} en F + ( v ) {\displaystyle F_{+}(v)} .

Veamos que f {\displaystyle f} es inyectiva. Como es lineal, basta ver que su núcleo se anula. Tomamos x F + ( u ) E = F + ( v ) ( F ( v ) F 0 ( v ) ) {\displaystyle x\in F_{+}(u)\subseteq E=F_{+}(v)\oplus (F_{-}(v)\oplus F_{0}(v))} y sea x = y + z {\displaystyle x=y+z} , donde y F + ( v ) , z F ( v ) F 0 ( v ) {\displaystyle y\in F_{+}(v),z\in F_{-}(v)\oplus F_{0}(v)} están unívocamente determinados porque los espacios están en suma directa. Supogamos pues que f ( x ) = 0 {\displaystyle f(x)=0} . Entonces, 0 = f ( x ) = π ( i ( x ) ) = π ( x ) = π ( y + z ) = y {\displaystyle 0=f(x)=\pi (i(x))=\pi (x)=\pi (y+z)=y} , por lo que y = 0 {\displaystyle y=0} y x = z {\displaystyle x=z} . Pero x F + ( u ) q φ ( x ) 0 {\displaystyle x\in F_{+}(u)\Rightarrow q_{\varphi }(x)\geq 0} y x = z F ( v ) F 0 ( v ) q φ ( x ) 0 {\displaystyle x=z\in F_{-}(v)\oplus F_{0}(v)\Rightarrow q_{\varphi }(x)\leq 0} , por lo que necesariamente q φ ( x ) = 0 {\displaystyle q_{\varphi }(x)=0} , y x = 0 {\displaystyle x=0} , pues x F + ( u ) {\displaystyle x\in F_{+}(u)} y cualquier otro vector de F + ( u ) {\displaystyle F_{+}(u)} tiene q φ ( x ) > 0 {\displaystyle q_{\varphi }(x)>0} .

Por tanto, se tiene que i + ( u ) = dim F + ( u ) dim F + ( v ) = i + ( v ) {\displaystyle i_{+}(u)=\dim F_{+}(u)\leq \dim F_{+}(v)=i_{+}(v)} . Por simetría obtenemos la igualdad. Ahora, como i ( u ) = n i + ( u ) i 0 ( u ) {\displaystyle i_{-}(u)=n-i_{+}(u)-i_{0}(u)} e i + ( u ) , i + ( u ) {\displaystyle i_{+}(u),i_{+}(u)} no dependen de la base, tampoco depende i ( u ) {\displaystyle i_{-}(u)} . {\displaystyle \quad \square }

Este resultado se conoce como ley de inercia de Sylvester e i + , i {\displaystyle i_{+},i_{-}} índices de inercia positivo y negativo de la forma cuadrática y al par ( i + , i ) {\displaystyle (i_{+},i_{-})} , signatura. Hemos visto que una forma cuadrática queda totalmente clasificada por el par ( i + , i ) {\displaystyle (i_{+},i_{-})} , pero también basta el par ( r , i + ) {\displaystyle (r,i_{+})} , donde r {\displaystyle r} es el rango de la forma cuadrática ( i {\displaystyle i_{-}} queda determinado como i = r i + {\displaystyle i_{-}=r-i_{+}} ). Para calcular los índices de inercia de una forma cuadrática determinada se puede usar el método de Gauss para transformar la matriz de la forma en una matriz diagonal repitiendo mismas transformaciones por filas y por columnas para no perder la simetría (si no no sería un cambio de base de formas cuadráticas). Se acaba llegando a una matriz diagonal porque la matriz original es simétrica. En la matriz resultante basta contar los elementos positivos para obtener i + {\displaystyle i_{+}} .

Propiedades

  • Cuando K = R {\displaystyle K=\mathbb {R} } se dice que la forma cuadrática es real.
  • Dos formas cuadráticas pueden ser:
    • linealmente equivalentes en R {\displaystyle \mathbb {R} } si las signaturas de ambas formas cuadráticas coinciden.
    • linealmente equivalentes en C {\displaystyle \mathbb {C} } si los rangos de las matrices de las formas cuadráticas coinciden.
    • métricamente equivalentes si poseen el mismo polinomio característico.
  • Una forma cuadrática define un espacio vectorial euclídeo si y sólo si es definida positiva, lo cual se puede comprobar utilizando el criterio de Sylvester.

Forma cuadrática definida

Se dice que una forma cuadrática q : V R {\displaystyle q:V\to \mathbb {R} } es definida si para todo x 0 V {\displaystyle x\neq 0\in V} se verifica:

q ( x ) = b p ( x , x ) 0 {\displaystyle q(x)=b_{p}(x,x)\neq 0}

siendo b p {\displaystyle b_{p}} la forma polar de la forma cuadrática.

En el caso antes mencionado, si una forma cuadrática es definida entonces:

  • o es definida positiva q ( x ) > 0 x V 0 x {\displaystyle q(x)>0\quad \forall x\in V\quad 0\neq x}
  • o es definida negativa q ( x ) < 0 x V 0 x {\displaystyle q(x)<0\quad \forall x\in V\quad 0\neq x}
Demostración
Se procederá por reducción al absurdo.

Supongamos que q es definida y que existen q(x)<0 y q(y)>0 y se busca q ( λ x + y ) = 0 {\displaystyle q(\lambda x+y)=0} , λ R {\displaystyle \lambda \in \mathbb {R} }

Desarrollando se tiene:

  q ( λ x + y ) = λ 2 q ( x ) + 2 λ b p ( x , y ) + q ( y ) {\displaystyle \ q(\lambda x+y)=\lambda ^{2}q(x)+2\lambda b_{p}(x,y)+q(y)}

Despejando

λ = b p ( x , y ) ± b p ( x , y ) 2 q ( x ) q ( y ) q ( x ) {\displaystyle \lambda ={\dfrac {-b_{p}(x,y)\pm {\sqrt {b_{p}(x,y)^{2}-q(x)q(y)}}}{q(x)}}}

Como q(x)<0 y q(y)>0 el discriminante es positivo y existe solución distinta de la trivial que verifica q ( λ x + y ) = 0 {\displaystyle q(\lambda x+y)=0} con lo que se llega a un absurdo pues se supuso que la forma cuadrática era definida.

Una forma cuadrática es definida positiva (negativa) si todos los autovalores de su matriz asociada son positivos (negativos)

Demostración
Sea A la matriz asociada a la forma polar de la forma cuadrática. Entonces q ( x ) = x t A x {\displaystyle q(x)=x^{t}Ax}

Dado que A es una matriz simétrica existe una base de autovectores ortogonales { e i } {\displaystyle \{e_{i}\}} con autovalores { λ i } {\displaystyle \{\lambda _{i}\}} .

En la base de autovectores se tiene x = i c i e i {\displaystyle x=\sum _{i}c_{i}e_{i}}

Operando (omitiendo sumatorios):

q ( x ) = x t A x = c j e j λ i c i e i = λ i c i c j δ i j = λ i c i 2 {\displaystyle q(x)=x^{t}Ax=c_{j}e_{j}\lambda _{i}c_{i}e_{i}=\lambda _{i}c_{i}c_{j}\delta _{i}^{j}=\lambda _{i}c_{i}^{2}}

Que es positivo (negativo) en general si y solo si λ i > ( < ) 0 i {\displaystyle \lambda _{i}>(<)0\quad \forall i}

Representación gráfica

El caso de que V = R 2 {\displaystyle V=\mathbb {R} ^{2}} , una forma cuadrática, puede representarse por un conjunto de cónicas. Si la signatura de la forma cuadrática es 2, entonces las curvas serán un conjunto de elipses, si la signatura es 1 será un conjunto de parábola y si la signatura es 0 entonces será un conjunto de hipérbolas.

A todos los vectores cuyo extremo caiga sobre la misma curva cuadrática se les asignará el mismo valor numérico.

Acotación de una forma cuadrática

Sea la forma cuadrática Q : R n R {\displaystyle Q:\,\mathbb {R} ^{n}\to \mathbb {R} } definida por Q ( x ) = x T A x {\displaystyle Q(x)=x^{T}Ax\,} , con A R n × n {\displaystyle A\in \mathbb {R} ^{n\times n}} simétrica. Esta matriz es diagonalizable ortogonalmente siempre.


Si pensamos en la factorización A = P Δ P T {\displaystyle A=P\Delta P^{T}\,} con P R n × n {\displaystyle P\in \mathbb {R} ^{n\times n}} una matriz ortogonal compuesta por autovectores de A {\displaystyle A\,} y Δ R n × n {\displaystyle \Delta \in \mathbb {R} ^{n\times n}\,} una matriz diagonal compuesta por los autovalores de A {\displaystyle A\,} en su diagonal, vemos que la forma cuadrática se reduce a


Q ( x ) = x T P Δ P T x {\displaystyle Q(x)=x^{T}P\Delta P^{T}x\,}


Si llamamos y = P T x {\displaystyle y=P^{T}x\,} , entonces tenemos que y T = ( P T x ) T = x T P {\displaystyle y^{T}=\left(P^{T}x\right)^{T}=x^{T}P\,} . Reemplazando en la ecuación anterior tenemos que


Q ( x ) = Q ^ ( y ) = y T Δ y {\displaystyle Q(x)={\hat {Q}}(y)=y^{T}\Delta y}


Y sabemos que Δ = diag [ λ 1 λ n ] T {\displaystyle \Delta =\operatorname {diag} [\lambda _{1}\quad \cdots \quad \lambda _{n}]^{T}} , con λ i , 1 i n {\displaystyle \lambda _{i},\,\,1\leq i\leq n} autovalor de A {\displaystyle A\,} . Por lo que si el cambio de variables propuesto es tal que y = [ y 1 y n ] T {\displaystyle y=[y_{1}\quad \cdots \quad y_{n}]^{T}} tenemos que


Q ^ ( y ) = i = 1 n λ i y i 2 {\displaystyle {\hat {Q}}(y)=\sum _{i=1}^{n}\lambda _{i}y_{i}^{2}}


A este tipo de forma cuadrática se la llama "forma cuadrática sin productos cruzados".

Sean, λ 1 λ n {\displaystyle \lambda _{1}\geq \cdots \geq \lambda _{n}\,} los autovalores de A {\displaystyle A\,} ordenados de forma decreciente. Es decir, λ m a x = λ 1 λ m i n = λ n {\displaystyle \lambda _{\rm {max}}=\lambda _{1}\quad \wedge \quad \lambda _{\rm {min}}=\lambda _{n}} . Entonces tenemos que


Q ^ ( y ) = i = 1 n λ i y i 2 λ m a x i = 1 n y i 2 {\displaystyle {\hat {Q}}(y)=\sum _{i=1}^{n}\lambda _{i}y_{i}^{2}\quad \leq \quad \lambda _{\rm {max}}\sum _{i=1}^{n}y_{i}^{2}}

Q ^ ( y ) = i = 1 n λ i y i 2 λ m i n i = 1 n y i 2 {\displaystyle {\hat {Q}}(y)=\sum _{i=1}^{n}\lambda _{i}y_{i}^{2}\quad \geq \quad \lambda _{\rm {min}}\sum _{i=1}^{n}y_{i}^{2}}


Por otro lado, observando bien el siguiente término, nos damos cuenta de que i = 1 n y i 2 = y 2 {\displaystyle \sum _{i=1}^{n}y_{i}^{2}=\|y\|^{2}\,} . Por lo tanto,


λ m i n y 2 Q ^ ( y ) λ m a x y 2 {\displaystyle \lambda _{\rm {min}}\|y\|^{2}\quad \leq \quad {\hat {Q}}(y)\quad \leq \quad \lambda _{\rm {max}}\|y\|^{2}}


Pero una de las propiedades fundamentales de las matrices ortogonales es que conservan el producto interno, pues en particular y 2 = ( y , y ) = ( P T x , P T x ) = ( P T x ) T P T x = x T P P T x = x T x = x 2 {\displaystyle \|y\|^{2}=(y,y)=\left(P^{T}x,P^{T}x\right)=\left(P^{T}x\right)^{T}P^{T}x=x^{T}PP^{T}x=x^{T}x=\|x\|^{2}} . Entonces, finalmente tenemos que


λ m i n x 2 Q ( x ) λ m a x x 2 {\displaystyle \lambda _{\rm {min}}\|x\|^{2}\quad \leq \quad Q(x)\quad \leq \quad \lambda _{\rm {max}}\|x\|^{2}}


Y ocurre que Q ( x ) = λ m i n x 2 {\displaystyle Q(x)=\lambda _{\rm {min}}\|x\|^{2}\,} cuando el vector x S λ m i n {\displaystyle x\in S_{\lambda _{\rm {min}}}} y también Q ( x ) = λ m a x x 2 {\displaystyle Q(x)=\lambda _{\rm {max}}\|x\|^{2}\,} cuando el vector x S λ m a x {\displaystyle x\in S_{\lambda _{\rm {max}}}} , siendo S λ m a x {\displaystyle S_{\lambda _{\rm {max}}}} y S λ m i n {\displaystyle S_{\lambda _{\rm {min}}}} los autoespacios asociados a los autovalores máximo y mínimo respectivamente.

Referencias


Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q736753
  • Commonscat Multimedia: Quadratic equation / Q736753

  • Identificadores
  • BNF: 11935832h (data)
  • GND: 4128297-8
  • LCCN: sh85050828
  • NDL: 00568586
  • NKC: ph520062
  • NLI: 987007545854605171
  • Wd Datos: Q736753
  • Commonscat Multimedia: Quadratic equation / Q736753