Funkcje kwadratowe na $\mathbb{K}^n$

Definicja (#) Funkcją kwadratową na $ \K^n $ nazywamy funkcję $ f:\K^n\to\K $ postaci

$ (\ast) $ $ f(X)=X^TAX+B^TX+c $, gdzie $ A=A^T\in\M{n}{n}{\K} $, $ A\neq\0 $, $ B\in\K^n $, $ c=f(\0)\in\K $.

Niezerową formę kwadratową $ Q(X)=X^TAX $ będziemy nazywać częścią kwadratową funkcji $ f $.

Uwaga (#) Funkcja kwadratowa $ f $ wyznacza swoją część kwadratową. Istotnie, dla $ X,Y\in\K^n $ mamy $ f(X+Y)-f(X)-f(Y)+f(\0)=(X+Y)^TA(X+Y)+B^T(X+Y)+c- (X^TAX+B^TX+c)-(Y^TAY+B^TY+c)+c=X^TAY+Y^TAX=2X^TAY $.

Dla $ n=1 $ funkcję kwadratową $ f(x)=ax^2+bx+c=0 $, $ a\neq 0 $, redukuje się do postaci $ ay^2+c' $ podstawieniem $ y=x+\frac{b}{2a} $ odpowiadającym złożeniu $ f\circ g $ funkcji $ f $ z przesunięciem $ g(y)=y-\frac{b}{2a} $. Ta obserwacja jest szczególnym przypadkiem głównego twierdzenia w tej części - twierdzenia o redukcji afinicznej.

Uwaga (#) Dla izomorfizmu afinicznego $ g:\K^n\to\K^n $ danego wzorem $ g(Z)=MZ+X_0 $, zob.\ [link], i funkcji kwadratowej $ f:\K^n\to\K $ opisanej formułą $ (\ast) $, złożenie $ f\circ g:\K^n\to\K $ jest funkcją kwadratową opisaną wzorem

$ (\ast\ast) $ $ f\circ g(Z)=Z^TA'Z+B'^TZ+c' $, gdzie $ A'=M^TAM $, $ B'=(2X_0^TA+B^T)M $, $ c'=f(X_0) $.

W szczególności, macierz $ A' $ części kwadratowej funkcji $ f\circ g $ jest kongruentna z macierzą $ A $.

Istotnie, podstawiając $ g(Z)=MZ+X_0 $ do $ (\ast) $ dostajemy $ (MZ+X_0)^TA(MZ+X_0)+B^T(MZ+X_0)+c= (MZ)^TA(MZ)+((MZ)^TAX_0+X_0^TAMZ+B^TMZ)+(X_0^TAX_0+B^TX_0+c) $ i ponieważ składniki tej sumy są skalarami, a macierz $ A $ jest symetryczna, mamy $ (MZ)^TAX_0=X_0^TAMZ $, więc wyrażenie w pierwszym nawiasie można zapisać w postaci $ (2X_0^TA+B^T)MZ $.

Pokażemy, że izomorfizm $ g $ można dobrać tak, by złożenie $ f\circ g(Z) $ było dane prostym wzorem.

Twierdzenie {\bf (o redukcji afinicznej).}(#) Dla każdej funkcji kwadratowej $ f:\K^n\to\K $ istnieje izomorfizm afiniczny $ g:\K^n\to\K^n $ taki, że $ f\circ g(Z) $ jest dane jednym ze wzorów:

(AI)$ _r $ $ f\circ g(Z)=d_1z_1^2+\ldots+d_rz_r^2+c' $, \qquad $ d_j\neq 0 $ dla $ j\leq r $,

(AII)$ _r $ $ f\circ g(Z)=d_1z_1^2+\ldots+d_rz_r^2+z_n $, $ d_j\neq 0 $ dla $ j\leq r<n $,

gdzie $ Z=[z_1,\ldots,z_n]^T $, a $ r=\r(Q) $ jest rzędem części kwadratowej $ f $.

{\bf Dowód twierdzenia.} Niech $ f $ będzie funkcją daną wzorem $ (\ast) $. Z Twierdzenia [link] istnieje macierz odwracalna $ M\in\M{n}{n}{\K} $ taka, że $ M^TAM $ jest macierzą diagonalną mającą na przekątnej niezerowe wyrazy $ d_1,\ldots,d_r $ na kolejnych pierwszych $ r $ miejscach oraz $ n-r $ zer na pozostałych miejscach.

Dla izomorfizmu liniowego $ g_1(Y)=MY $, gdzie $ Y=[y_1,\ldots,y_n]^T $, złożenie $ f\circ g_1 $ jest opisane wzorem $ f\circ g_1(Y)=Y^TM^TAMY+B^TMY+c $ i przyjmując $ B^TM=[a_1,\ldots,a_n] $, dostajemy $ f\circ g_1(Y)= d_1y_1^2+\ldots+d_ry_r^2+a_1y_1+\ldots+a_ny_n+c= d_1(y_1+\frac{a_1}{2d_1})^2+\ldots+d_r(y_r+\frac{a_r}{2d_r})^2+ a_{r+1}y_{r+1}+\ldots+a_ny_n+c' $.

Izomorfizm $ g_2 $ odwrotny do podstawienia $ z_j=y_j+\frac{a_j}{2d_j} $ dla $ j\leq r $ i $ z_j=y_j $ dla $ j>r $ jest przesunięciem takim, że złożenie $ f\circ g_1\circ g_2 $ jest opisane wzorem $ f\circ g_1\circ g_2(Z)= d_1z_1^2+\ldots+d_rz_r^2+a_{r+1}z_{r+1}+\ldots+a_nz_n+c' $, $ Z=[z_1,\ldots,z_n]^T $.

(I) Jeśli wszystkie współczynniki $ a_{r+1},\ldots,a_n $ są zerowe, to dla $ g=g_1\circ g_2 $ mamy wzór (AI)$ _r $.

(II) Jeśli dla pewnego $ i>r $ współczynnik $ a_i\neq 0 $, to podstawienie $ \tilde{z}_i=a_{r+1}z_{r+1}+\ldots+a_nz_n+c' $ oraz $ \tilde{z}_j=z_j $ dla $ j\neq i $ jest odwracalne, a izomorfizm afiniczny $ g_3 $ odwrotny do tego podstawienia prowadzi do wzoru $ f\circ g_1\circ g_2\circ g_3(\tilde{Z})= d_1\tilde{z}_1^2+\ldots+d_r\tilde{z}_r^2+\tilde{z}_i $, $ \tilde{Z}=[\tilde{z}_1,\ldots,\tilde{z}_n]^T $, z którego po zmianie współrzędnej $ \tilde{z}_i $ z $ \tilde{z}_n $, określającej izomorfizm $ g_4 $, dostajemy dla $ g=g_1\circ g_2\circ g_3\circ g_4 $ wzór (AII)$ _r $. \null
\null$ \blacksquare $    

Uwaga (#) Jeśli, w oznaczeniach Twierdzenia [link], układ równań $ 2AX+B=\0 $ ma rozwiązanie $ X_0\in\K^n $, to $ \0^T=(2AX_0+B)^T=2X_0^TA+B^T $, więc z $ (\ast\ast) $ dla izomorfizmu afinicznego $ g(Z)=MZ+X_0 $ (gdzie macierz $ M $ jest taka jak w dowodzie twierdzenia), złożenie $ f\circ g $ jest opisane wzorem (AI)$ _r $.

Uwaga [link] wskazuje własność wyróżniającą funkcje kwadratowe redukujące się do postaci (AI)$ _r $.

Definicja (#) Wektor $ X_0\in\K^n $ nazywamy środkiem symetrii funkcji $ f:\K^n\to\K $, jeśli $ f(X_0+X)=f(X_0-X) $ dla $ X\in\K^n $. Zbiór środków symetrii funkcji $ f $ oznaczamy przez $ C(f) $.

Pokażemy, że układ równań z Uwagi [link] opisuje zbiór środków symetrii funkcji kwadratowej $ f $.

Uwaga (#) Dla funkcji kwadratowej $ f $ danej wzorem $ (\ast) $ równość $ f(X_0+X)=f(X_0-X) $ oznacza (ze wzoru $ (\ast\ast) $ dla $ M=\pm I_n $), że $ X^TAX+(2X_0^TA+B^T)X+c'=(-X)^TA(-X)+(2X_0^TA+B^T)(-X)+c' $, czyli $ (2X_0^TA+B^T)X=0 $, a stąd zbiór $ C(f) $ jest zbiorem rozwiązań układu równań $ 2AX+B=\0 $.
Uwaga (#) Niech $ f $ i $ g $ będą takie jak w Twierdzeniu [link] i załóżmy, że $ f'=f\circ g $ jest dana wzorem (AI)$ _r $. Zbiór $ C(f') $ jest opisany układem równań $ z_{1}=\ldots=z_r=0 $ i $ f' $ jest stale równa $ c' $ na tym zbiorze. Co więcej, $ C(f)=g(C(f')) $ (bo dla $ X_0=g(Z_0) $ i $ X=\p{g}(Z) $ mamy $ f(X_0\pm X)=f(g(Z_0\pm Z)) $, więc $ X_0\in C(f) $ jeśli $ Z_0\in C(f') $) i $ f $ jest stale równa $ c' $ na $ C(f) $. Funkcja $ f'' $ dana wzorem (AII)$ _r $ nie ma środków symetrii, więc nie może być zredukowana do żadnej funkcji danej wzorem (AI)$ _r $.