Funkcje kwadratowe

Także i w tym rozdziale utrzymujemy założenie, że ciało $ \K $ ma charakterystykę różną od $ 2 $.

Funkcje kwadratowe na $\mathbb{K}^n$

Definicja (#) Funkcją kwadratową na $ \K^n $ nazywamy funkcję $ f:\K^n\to\K $ postaci

$ (\ast) $ $ f(X)=X^TAX+B^TX+c $, gdzie $ A=A^T\in\M{n}{n}{\K} $, $ A\neq\0 $, $ B\in\K^n $, $ c=f(\0)\in\K $.

Niezerową formę kwadratową $ Q(X)=X^TAX $ będziemy nazywać częścią kwadratową funkcji $ f $.

Uwaga (#) Funkcja kwadratowa $ f $ wyznacza swoją część kwadratową. Istotnie, dla $ X,Y\in\K^n $ mamy $ f(X+Y)-f(X)-f(Y)+f(\0)=(X+Y)^TA(X+Y)+B^T(X+Y)+c- (X^TAX+B^TX+c)-(Y^TAY+B^TY+c)+c=X^TAY+Y^TAX=2X^TAY $.

Dla $ n=1 $ funkcję kwadratową $ f(x)=ax^2+bx+c=0 $, $ a\neq 0 $, redukuje się do postaci $ ay^2+c' $ podstawieniem $ y=x+\frac{b}{2a} $ odpowiadającym złożeniu $ f\circ g $ funkcji $ f $ z przesunięciem $ g(y)=y-\frac{b}{2a} $. Ta obserwacja jest szczególnym przypadkiem głównego twierdzenia w tej części - twierdzenia o redukcji afinicznej.

Uwaga (#) Dla izomorfizmu afinicznego $ g:\K^n\to\K^n $ danego wzorem $ g(Z)=MZ+X_0 $, zob.\ [link], i funkcji kwadratowej $ f:\K^n\to\K $ opisanej formułą $ (\ast) $, złożenie $ f\circ g:\K^n\to\K $ jest funkcją kwadratową opisaną wzorem

$ (\ast\ast) $ $ f\circ g(Z)=Z^TA'Z+B'^TZ+c' $, gdzie $ A'=M^TAM $, $ B'=(2X_0^TA+B^T)M $, $ c'=f(X_0) $.

W szczególności, macierz $ A' $ części kwadratowej funkcji $ f\circ g $ jest kongruentna z macierzą $ A $.

Istotnie, podstawiając $ g(Z)=MZ+X_0 $ do $ (\ast) $ dostajemy $ (MZ+X_0)^TA(MZ+X_0)+B^T(MZ+X_0)+c= (MZ)^TA(MZ)+((MZ)^TAX_0+X_0^TAMZ+B^TMZ)+(X_0^TAX_0+B^TX_0+c) $ i ponieważ składniki tej sumy są skalarami, a macierz $ A $ jest symetryczna, mamy $ (MZ)^TAX_0=X_0^TAMZ $, więc wyrażenie w pierwszym nawiasie można zapisać w postaci $ (2X_0^TA+B^T)MZ $.

Pokażemy, że izomorfizm $ g $ można dobrać tak, by złożenie $ f\circ g(Z) $ było dane prostym wzorem.

Twierdzenie {\bf (o redukcji afinicznej).}(#) Dla każdej funkcji kwadratowej $ f:\K^n\to\K $ istnieje izomorfizm afiniczny $ g:\K^n\to\K^n $ taki, że $ f\circ g(Z) $ jest dane jednym ze wzorów:

(AI)$ _r $ $ f\circ g(Z)=d_1z_1^2+\ldots+d_rz_r^2+c' $, \qquad $ d_j\neq 0 $ dla $ j\leq r $,

(AII)$ _r $ $ f\circ g(Z)=d_1z_1^2+\ldots+d_rz_r^2+z_n $, $ d_j\neq 0 $ dla $ j\leq r<n $,

gdzie $ Z=[z_1,\ldots,z_n]^T $, a $ r=\r(Q) $ jest rzędem części kwadratowej $ f $.

{\bf Dowód twierdzenia.} Niech $ f $ będzie funkcją daną wzorem $ (\ast) $. Z Twierdzenia [link] istnieje macierz odwracalna $ M\in\M{n}{n}{\K} $ taka, że $ M^TAM $ jest macierzą diagonalną mającą na przekątnej niezerowe wyrazy $ d_1,\ldots,d_r $ na kolejnych pierwszych $ r $ miejscach oraz $ n-r $ zer na pozostałych miejscach.

Dla izomorfizmu liniowego $ g_1(Y)=MY $, gdzie $ Y=[y_1,\ldots,y_n]^T $, złożenie $ f\circ g_1 $ jest opisane wzorem $ f\circ g_1(Y)=Y^TM^TAMY+B^TMY+c $ i przyjmując $ B^TM=[a_1,\ldots,a_n] $, dostajemy $ f\circ g_1(Y)= d_1y_1^2+\ldots+d_ry_r^2+a_1y_1+\ldots+a_ny_n+c= d_1(y_1+\frac{a_1}{2d_1})^2+\ldots+d_r(y_r+\frac{a_r}{2d_r})^2+ a_{r+1}y_{r+1}+\ldots+a_ny_n+c' $.

Izomorfizm $ g_2 $ odwrotny do podstawienia $ z_j=y_j+\frac{a_j}{2d_j} $ dla $ j\leq r $ i $ z_j=y_j $ dla $ j>r $ jest przesunięciem takim, że złożenie $ f\circ g_1\circ g_2 $ jest opisane wzorem $ f\circ g_1\circ g_2(Z)= d_1z_1^2+\ldots+d_rz_r^2+a_{r+1}z_{r+1}+\ldots+a_nz_n+c' $, $ Z=[z_1,\ldots,z_n]^T $.

(I) Jeśli wszystkie współczynniki $ a_{r+1},\ldots,a_n $ są zerowe, to dla $ g=g_1\circ g_2 $ mamy wzór (AI)$ _r $.

(II) Jeśli dla pewnego $ i>r $ współczynnik $ a_i\neq 0 $, to podstawienie $ \tilde{z}_i=a_{r+1}z_{r+1}+\ldots+a_nz_n+c' $ oraz $ \tilde{z}_j=z_j $ dla $ j\neq i $ jest odwracalne, a izomorfizm afiniczny $ g_3 $ odwrotny do tego podstawienia prowadzi do wzoru $ f\circ g_1\circ g_2\circ g_3(\tilde{Z})= d_1\tilde{z}_1^2+\ldots+d_r\tilde{z}_r^2+\tilde{z}_i $, $ \tilde{Z}=[\tilde{z}_1,\ldots,\tilde{z}_n]^T $, z którego po zmianie współrzędnej $ \tilde{z}_i $ z $ \tilde{z}_n $, określającej izomorfizm $ g_4 $, dostajemy dla $ g=g_1\circ g_2\circ g_3\circ g_4 $ wzór (AII)$ _r $. \null
\null$ \blacksquare $    

Uwaga (#) Jeśli, w oznaczeniach Twierdzenia [link], układ równań $ 2AX+B=\0 $ ma rozwiązanie $ X_0\in\K^n $, to $ \0^T=(2AX_0+B)^T=2X_0^TA+B^T $, więc z $ (\ast\ast) $ dla izomorfizmu afinicznego $ g(Z)=MZ+X_0 $ (gdzie macierz $ M $ jest taka jak w dowodzie twierdzenia), złożenie $ f\circ g $ jest opisane wzorem (AI)$ _r $.

Uwaga [link] wskazuje własność wyróżniającą funkcje kwadratowe redukujące się do postaci (AI)$ _r $.

Definicja (#) Wektor $ X_0\in\K^n $ nazywamy środkiem symetrii funkcji $ f:\K^n\to\K $, jeśli $ f(X_0+X)=f(X_0-X) $ dla $ X\in\K^n $. Zbiór środków symetrii funkcji $ f $ oznaczamy przez $ C(f) $.

Pokażemy, że układ równań z Uwagi [link] opisuje zbiór środków symetrii funkcji kwadratowej $ f $.

Uwaga (#) Dla funkcji kwadratowej $ f $ danej wzorem $ (\ast) $ równość $ f(X_0+X)=f(X_0-X) $ oznacza (ze wzoru $ (\ast\ast) $ dla $ M=\pm I_n $), że $ X^TAX+(2X_0^TA+B^T)X+c'=(-X)^TA(-X)+(2X_0^TA+B^T)(-X)+c' $, czyli $ (2X_0^TA+B^T)X=0 $, a stąd zbiór $ C(f) $ jest zbiorem rozwiązań układu równań $ 2AX+B=\0 $.
Uwaga (#) Niech $ f $ i $ g $ będą takie jak w Twierdzeniu [link] i załóżmy, że $ f'=f\circ g $ jest dana wzorem (AI)$ _r $. Zbiór $ C(f') $ jest opisany układem równań $ z_{1}=\ldots=z_r=0 $ i $ f' $ jest stale równa $ c' $ na tym zbiorze. Co więcej, $ C(f)=g(C(f')) $ (bo dla $ X_0=g(Z_0) $ i $ X=\p{g}(Z) $ mamy $ f(X_0\pm X)=f(g(Z_0\pm Z)) $, więc $ X_0\in C(f) $ jeśli $ Z_0\in C(f') $) i $ f $ jest stale równa $ c' $ na $ C(f) $. Funkcja $ f'' $ dana wzorem (AII)$ _r $ nie ma środków symetrii, więc nie może być zredukowana do żadnej funkcji danej wzorem (AI)$ _r $.

Klasyfikacja funkcji kwadratowych na $\mathbb{R}^n$

Dla $ \K=\R $ tezę Twierdzenia [link] można wzmocnić, korzystając z Uwagi [link].

Twierdzenie (#) Dla każdej funkcji kwadratowej $ f:\R^n\to\R $ istnieje izomorfizm afiniczny $ g:\R^n\to\R^n $ taki, że złożenie $ f\circ g(Z) $ jest opisane jednym ze wzorów:

(AI)$ _{s,r} $ $ f\circ g(Z)=z_1^2+\ldots+z_s^2-z_{s+1}^2-\ldots-z_r^2+c' $, \ \qquad $ s\leq r\leq n $,

(AII)$ _{s,r} $ $ f\circ g(Z)=z_1^2+\ldots+z_s^2-z_{s+1}^2-\ldots-z_r^2+z_n $, \qquad $ s\leq r<n $,

gdzie $ Z=[z_1,\ldots,z_n]^T $, a $ r=\r(Q) $ i $ s=s_+(Q) $ dla formy $ Q $ będącej częścią kwadratową $ f $.

Definicja Powiemy, że funkcje $ f,f':\R^n\to\R $ są afinicznie równoważne jeśli istnieje izomorfizm afiniczny $ g:\R^n\to\R^n $ taki, że $ f'=f\circ g $.

Z Uwag [link] i [link] wynika następująca obserwacja.

Uwaga (#) Każda funkcja kwadratowa na $ \R^n $ jest afinicznie równoważna dokładnie jednej z funkcji typu (AI)$ _{s,r} $ lub (AII)$ _{s,r} $ z Twierdzenia [link].

W kartezjańskiej przestrzeni euklidesowej $ (\R^n,\is{\ }{\,}) $ redukcję opisaną w Twierdzeniu [link], z pewnymi niewielkimi zmianami, można zrealizować przy pomocy izometrii (czyli izomorfizmów afinicznych $ \R^n $, których część liniowa jest opisana macierzą ortogonalną, zob.\ Twierdzenie [link]).

Twierdzenie {\bf (o redukcji euklidesowej).}(#) Dla każdej funkcji kwadratowej $ f:\R^n\to\R $ na kartezjańskiej przestrzeni euklidesowej $ (\R^n,\is{\ }{\,}) $ istnieje izometria $ g:\R^n\to\R^n $ taka, że złożenie $ f\circ g(Z) $ jest opisane jednym ze wzorów:

(EI)$ _{\la_1,\ldots,\la_r} $ $ f\circ g(Z)=\la_1z_1^2+\ldots+\la_rz_r^2+c' $, \qquad $ \la_1\geq\ldots\geq\la_r $ i $ \la_j\neq 0 $ dla $ j\leq r $,

(EII)$ _{\la_1,\ldots,\la_r} $ $ f\circ g(Z)=\la_1z_1^2+\ldots+\la_rz_r^2+b z_n $, $ \la_1\geq\ldots\geq\la_r $ i $ \la_j\neq 0 $ dla $ j\leq r<n $,

gdzie $ Z=[z_1,\ldots,z_n]^T $, a $ \la_1,\ldots,\la_r $ są niezerowymi wartościami własnymi symetrycznej macierzy $ A\in\M{n}{n}{\R} $ takiej, że forma $ Q(X)=X^TAX $ jest częścią kwadratową $ f $.

Dowód: W dowodzie [link] trzeba jedynie dokonać następujących modyfikacji.

Izomorfizm $ g_1 $ należy zastąpić izometrią liniową $ g_1(X)=MX $, gdzie $ M $ jest macierzą ortogonalną otrzymaną z występującej we Wniosku [link] macierzy ortogonalnej $ C $, której kolumny zostały uporządkowane tak, aby odpowiadający im ciąg wartości własnych miał na początkowych $ r=\r A $ miejscach nierosnący ciąg wyrazów niezerowych i $ n-r $ zer na końcu.

Izomorfizm $ g_3\circ g_4 $ w kroku (II) należy zastąpić izometrią liniową $ g_3=\ta^{-1} $, gdzie $ \ta:\R^n\to\R^n $ jest prostokątnym układem współrzędnych nie zmieniającym pierwszych $ r $ współrzędnych wektora $ Z=[z_1,\ldots,z_n]^T $ i zastępującego ostatnią współrzędną sumą $ \frac{1}{b}(a_{r+1}z_{r+1}+\ldots+a_nz_n+c') $, gdzie $ b=\sqrt{\sum_{j=r+1}^na_j^2} $. Macierz ortogonalna $ M(g_3)=M({\ta})^{-1}=M({\ta})^T $ ma kolumny $ g_3(\ep_j)=\ep_j $ dla $ j\leq r $, a jej ostatnią kolumną jest $ g_3(\ep_n)=\frac{1}{b}\sum_{j=r+1}^n a_j\ep_j $.

Definicja Powiemy, że funkcje kwadratowe $ f,f':\R^n\to\R $ na kartezjańskiej przestrzeni euklidesowej $ (\R^n,\is{\ }{\,}) $ są euklidesowo równoważne, jeśli istnieje izometria $ g:\R^n\to\R^n $ taka, że $ f'=f\circ g $.

Z Twierdzenia [link], podobnie jak w Uwadze [link], wynika następująca obserwacja.

Uwaga (#) Każda funkcja kwadratowa na kartezjańskiej przestrzeni euklidesowej $ (\R^n,\is{\ }{\,}) $ jest euklidesowo równoważna dokładnie jednej z funkcji typu (EI)$ _{\la_1,\ldots,\la_r} $ lub (EII)$ _{\la_1,\ldots,\la_r} $ z Twierdzenia [link].