Uzupełnienia

Twierdzenie Weierstrassa

W tej części wyjaśnimy pominięte w tekście elementy dowodów związane z twierdzeniem Weierstrassa o istnieniu ekstremów funkcji ciągłych.

Zaczniemy od Lematu [link] użytego w dowodzie zasadniczego twierdzenia algebry.

Lemat (#)

Dla wielomianu zespolonego $ w(z)=a_0+a_1z+\ldots+z^n $ i $ K=\set{z\in\c:|\Re z|,|\Im z|\leq M} $ istnieje $ z_0\in K $ takie, że $ |w(z_0)|= \inf\set{|w(z)|: z\in K} $.

Dowód: Zaczniemy od warunku (ustalającego ciągłość funkcji $ |w(z)| $ zmiennej zespolonej). Dla każdego ciągu $ (z_m)_{m} $ liczb zespolonych

$ (\ast) $ $ \lim_{m}|z_m-z_0|= 0 \ \Rightarrow \ \lim_m |w(z_m)|=|w(z_0)| $.

Istotnie, dla $ h\in\c $ mamy $ w(z_0+h)-w(z_0)=A_1h+\ldots+A_nh^n $,

stąd $ |\,|w(z_0+h)|-|w(z_0)|\,|\leq |w(z_0+h)-w(z_0)|\leq |h|(|A_1|+\ldots+|A_n||h|^{n-1}) $.

Podstawiając w tej nierówności za $ h $ różnicę $ z_m-z_0 $ dostajemy $ (\ast) $.

Niech

$$\mu=\inf\set{|w(z)|:z\in K}.$$

Dla $ m=1,2,\ldots $ wybierzmy $ z_m=a_m+ib_m\in K $ tak, by ciąg $ (|w(z_m)|)_m $ zbiegał do $ \mu $. Z twierdzenia Bolzano-Weierstrassa możemy założyć, przechodząc w razie potrzeby do podciągu, że ciąg $ (a_m)_m $ jest zbieżny do pewnego $ a_0 $ z przedziału $ [-M,M] $. Przechodząc ponownie do podciągu możemy ponadto założyć, że ciąg $ (b_m)_m $ jest zbieżny do pewnego $ b_0\in[-M,M] $. Dla $ z_0=a_0+ib_0 $ mamy $ |z_m-z_0|=\sqrt{(a_m-a_0)^2+(b_m-b_0)^2} $, więc $ \lim_m |z_m-z_0|=0 $, a stąd i z $ (\ast) $ dostajemy $ \mu=\lim_m |w(z_m)|=|w(z_0)| $. □

W dowodzie Twierdzenia [link] korzystaliśmy z pewnej własności funkcji na sferze jednostkowej w liniowej przestrzeni euklidesowej, analogicznej do udowodnionej w Lemacie [link]. Podamy teraz uzasadnienie tej własności, przy czym podobieństwo do dowodu Lematu [link] nie jest przypadkowe - obie własności wynikają z twierdzenia Weierstrassa o funkcjach ciągłych na zwartych przestrzeniach metrycznych.

Lemat (#) Dla endomorfizmu $ \vp:V\to V $ liniowej przestrzeni euklidesowej $ (V,\is{\ }{\,}) $ istnieje wektor $ \be\in V $ taki, że $ ||\be||=1 $ \ oraz \ $ \is{\be}{\vp(\be)}= \sup\set{\is{\al}{\vp(\al)}:||\al||=1} $.
Dowód: Połóżmy $ Q(\al)=\is{\al}{\vp(\al)} $ dla $ \al\in V $. Sprawdzimy najpierw, że dla każdego ciągu wektorów $ (\al_m)_{m} $ takich, że $ ||\al_m||=1 $

$ (\ast)<table class="displaymath"><tr><td class="dspleft"><img class="teximage" src="/sites/default/files/tex/1646f273d133af3e7b773af503e0dbbf53529a72.png" alt="8fe86e329c04a1193237cc456a7cc71e:1:" /></td><td class="dspright"></td></tr></table>\mu=\sup\set{Q(\al):||\al||=1}. $$

Dla $ m=1,2,\ldots $ wybierzmy wektory $ \al_m $ o normie $ 1 $ tak, by ciąg $ (Q(\al_m))_m $ zbiegał do $ \mu $. Podobnie jak w dowodzie Lematu [link] wystarczy teraz pokazać, że dla pewnego podciągu $ (\al_{m_k})_k $ istnieje $ \be\in V $ takie, że $ \lim_k||\al_{m_k}-\be||=0 $, bo z warunku $ |\,||\al_m||-||\be||\,|\leq ||\al_m-\be|| $ wynika, że wtedy także $ ||\be||=1 $.

Udowodnimy przez indukcję ze względu na $ \dim V $, że dla każdego ciągu wektorów $ V $ o normie $ \leq 1 $ można znaleźć taki podciąg $ (\al_{m_k})_k $ i wektor $ \be $. Dla przestrzeni jednowymiarowych teza wynika z twierdzenia Bolzano-Weierstrassa. Załóżmy, że $ \dim V>1 $ i teza jest prawdziwa dla przestrzeni wymiaru mniejszego niż $ \dim V $.

Niech $ V=W\oplus L $ będzie sumą ortogonalną, gdzie $ \dim L=1 $ i niech $ \al_m=\be_m+\ga_m $ będzie rozkładem $ \al_m $ na ortogonalne składowe. Z założenia indukcyjnego wynika, że ciąg $ (\be_m)_m $ zawiera podciąg $ (\be_{m_j})_j $ taki, że $ \lim_j||\be_{m_j}-\be_0||=0 $ dla pewnego $ \be_0\in W $. Z twierdzenia Bolzano-Weierstrassa możemy wybrać z ciągu $ (\ga_{m_j})_j $ podciąg $ (\ga_{m_{j_k}})_k $ zbieżny do pewnego $ \ga_0\in L $. Dla wektora $ \be=\be_0+\ga_0 $ mamy wówczas $ \lim_k||\al_{m_{j_k}}-\be||=0 $. □

Zespolona wartość własna macierzy rzeczywistej

Dla macierzy $ A\in\M{n}{n}{\R} $ oznaczmy przez $ \vp $ endomorfizm $ \vp(X)=AX $ przestrzeni $ \R^n $ wyznaczony przez $ A $ i załóżmy, że $ Z=X+iY\in\c^n $, gdzie $ X,Y\in\R^n $, jest wektorem własnym $ A $ odpowiadającym zespolonej wartości własnej $ \la=a+ib\not\in\R $. Pokażemy, że

  • [(a)] wektory $ X,Y $ rozpinają w $ \R^n $ płaszczyznę $ W=\lin(X,Y) $ taką, że $ \vp(W)=W $ i macierz endomorfizmu $ \vp|W:W\to W $ w układzie współrzędnych związanym z bazą $ (X,Y) $ płaszczyzny $ W $ ma postać $ \mk{rr}{a&b\\-b&a} $;
  • [(b)] $ A^T\neq A $, por.\ Twierdzenie [link];
  • [(c)] jeśli $ A $ jest macierzą ortogonalną, to $ |\la|=1 $ i w kartezjańskiej przestrzeni euklidesowej, zob.\ [link] (a), $ ||X||=||Y|| $ oraz $ X\perp Y $. W szczególności, $ \vp|W $ jest obrotem $ W $, por.\ Lemat [link].

Istotnie, z równości $ AZ=\la Z $ mamy $ AX+iAY=(a+ib)(X+iY)=(aX-bY)+i(bX+aY) $. Porównując części rzeczywiste i urojone po obu stronach dostajemy stąd wzory

$ (\ast) $ $ AX=aX-bY $ \ oraz \ $ AY=bX+aY $

pokazujące, że $ \vp(W)\subset W $.

Połóżmy $ \overline{Z}=X-iY $. Z $ (\ast) $ mamy $ A\overline{Z}=AX-iAY=(aX-bY)-i(bX+aY)=(a-ib)(X-iY) $, czyli wektor $ \overline{Z} $ jest wektorem własnym $ A $ odpowiadającym wartości własnej $ \overline{\la} $. Zatem wektory $ Z,\overline{Z} $ rozpinają płaszczyznę $ \lin(Z,\overline{Z})\subset\c^n $. Wektory $ X=\frac{1}{2}(Z+\overline{Z}) $ i $ Y=-\frac{i}{2}(Z-\overline{Z}) $ są bazą tej płaszczyzny (nad $ \c $), więc są również liniowo niezależne nad $ \R $.

Stąd wynika (a), bo $ (\ast) $ określa postać macierzy $ \vp|W $ w tej bazie, a z $ \det(\vp|W)=a^2+b^2=|\la|> 0 $ mamy $ \vp(W)=W $.

Dla dowodu (b) załóżmy, że macierz $ A $ jest symetryczna. Wtedy $ (AZ)^T\overline{Z}=Z^T(A\overline{Z}) $, więc $ \la (Z^T\overline{Z})=(AZ)^T\overline{Z}=Z^T(A\overline{Z})= Z^T(\overline{\la}\, \overline{Z})= \overline{\la} (Z^T\overline{Z}) $. Ponieważ $ Z^T\overline{Z}=(X+iY)^T(X-iY)=||X^2||+||Y||^2>0 $, dostajemy $ \la=\overline{\la} $, sprzecznie z założeniem, że $ \la\not\in\R $.

Jeśli $ A $ jest macierzą ortogonalną, to $ \vp $ jest izometrią liniową kartezjańskiej przestrzeni euklidesowej, więc $ \det (\vp|W)=1=|\la| $, co daje pierwszą część (c). Mamy też $ AZ=\la Z $ oraz $ A^TZ=A^{-1}Z=\la^{-1}Z $. Zatem $ \la (Z^TZ)=(AZ)^TZ=Z^T(A^TZ)= Z^T(\la^{-1}Z)= \overline{\la} (Z^TZ) $. Ponieważ $ \la\neq\overline{\la} $, dostajemy stąd $ Z^TZ=0 $, czyli $ 0=(X+iY)^T(X+iY)=(||X^2||-||Y||^2)+2i(X^TY) $, co dowodzi (c).

Orientacja liniowej przestrzeni euklidesowej

Powiemy, że macierz $ A\in\M{n}{n}{\R} $ jest nieosobliwa jeśli $ \det A\neq 0 $ (równoważnie, macierz $ A $ jest odwracalna, zob.\ Uwaga [link]).

Drogą nieosobliwą w $ \M{n}{n}{\R} $ łączącą macierze nieosobliwe $ A,B\in\M{n}{n}{\R} $ będziemy nazywali przyporządkowanie każdemu $ t $ z przedziału $ [0,1]\subset\R $ macierzy nieosobliwej $ A(t)=[a_{ij}(t)]_{ij=1}^n $ takie, że $ A(0)=A $, $ A(1)=B $ i każda z funkcji $ a_{ij} $ jest ciągła.

Funkcja $ \det A(t) $ jest wtedy ciągła i nie zeruje się na $ [0,1] $, więc $ \det A $, $ \det B $ mają ten sam znak.

Pokażemy, że z równości znaków wyznaczników wynika istnienie takiej drogi: jeśli $ \det A>0 $, to istnieje nieosobliwa droga łącząca macierz $ A $ z macierzą jednostkową $ I_n $; jeśli dodatkowo macierz $ A $ jest ortogonalna, to istnieje taka droga złożona z macierzy ortogonalnych.

Załóżmy najpierw, że $ A $ jest macierzą ortogonalną. Z Wniosku [link] istnieje macierz ortogonalna $ C $ taka, że $ J=C^TA\,C $ ma na przekątnej macierze obrotów i jedynki ($ 2 $ wyrazy $ -1 $ na przekątnej $ J $ określają obrót o kąt $ \pi $ w odpowiedniej płaszczyźnie). Ponieważ macierz obrotu $ \R^2 $ o kąt $ \theta $ można połączyć (mnożąc kąt obrotu przez 1-t) z macierzą $ I_2 $, istnieją macierze ortogonalne $ J(t) $ tworzące drogę łączącą $ J $ z $ I_n $. Macierze $ CJ(t)\,C^T $ są wtedy ortogonalne i określają drogę łączącą $ A $ z $ I_n $.

Dla odwracalnej macierzy $ A $ nietrudno zauważyć, interpretując geometrycznie kolejne kroki procesu ortonormalizacji Grama-Schmidta układu kolumn $ A $, że powstającą w tym procesie macierz ortogonalną można połączyć drogą nieosobliwą z macierzą $ A $. Wraz z wcześniejszą obserwacją daje to nieosobliwą drogę łączącą macierz $ A $ z $ I_n $.

Istnienie takich dróg pozwala na następującą interpretację orientacji w liniowej przestrzeni euklidesowej $ \R^n $: baza $ (A_1,\ldots,A_n) $ jest zorientowana zgodnie z bazą standardową $ (\ep_1,\ldots,\ep_n) $ wtedy i tylko wtedy, gdy dla każdego $ t $ z przedziału $ [0,1] $ istnieje baza $ (A_1(t),\ldots,A_n(t)) $ taka, że $ A_j(0)=A_j $, $ A_j(1)=\ep_j $ oraz współrzędne wektorów $ A_j(t) $ zależą od $ t $ w sposób ciągły. Co więcej, dla ortonormalnej bazy $ (A_1,\ldots,A_n) $ istnieją takie bazy $ (A_1(t),\ldots,A_n(t)) $, które są dodatkowo ortonormalne.

Równania opisujące hiperpowierzchnię właściwą

W tej części podamy dowód Twierdzenia [link] mówiącego, że hiperpowierzchnia właściwa $ H $ stopnia $ 2 $ w przestrzeni afinicznej $ E $ nad $ \R $ wyznacza swoje równanie z dokładnością do stałej.

Załóżmy więc, że $ f,f_\ast:\R^n\to\R $ są funkcjami kwadratowymi takimi, że równania $ f(X)=0 $ i $ f_\ast(X)=0 $ opisują $ H $ w afinicznym układzie współrzędnych $ \si_p:E\to\R^n $. Dla uproszczenia oznaczeń połóżmy $ \phi=f\circ\si_p $ i $ \phi_\ast=f_\ast\circ\si_p $. Pokażemy, że $ \phi_\ast=\la \phi $ dla pewnego $ \la\in\R $.

Niech funkcja $ f $ będzie dana wzorem

$$f(X)=X^TAX+B^TX+c, \mbox{ gdzie } A=A^T\in\M{n}{n}{\R}, B\in\R^n, c\in\R$$

i oznaczmy przez $ Q $ część kwadratową $ f $, $ Q(X)=X^TAX $.

Jeśli $ L=q+\lin(\be) $ jest prostą w $ E $, $ X=\si_p(q) $ i $ Z=\si(\be) $, to $ \si_p(q+t\be)=\si_p(q)+\si(t\be)=X+tZ $, więc wartości funkcji $ \phi $ na prostej $ L $ są dane wzorem $ \phi(q+t\be)= f(X+tZ)=t^2Z^TAZ+t(2X^TA+B^T)Z+f(X) $ (zob.\ Uwaga [link] dla $ g(Z)=tZ+X $). Zatem

$ (\smile)\qquad\qquad\qquad \phi(q+t\be)=at^2+bt+c\  $, \ gdzie $ a=Q\circ\si(\be) $ i $ c=\phi(q) $.

Zgodnie z Uwagą [link], istnieje prosta $ L_0=q_0+\lin(\be_0) $ przecinająca $ H $ w dokładnie dwóch punktach. Z $ (\smile) $ wynika, że $ a=Q(\si(\be_0))\neq 0 $. Bez zmniejszenia ogólności możemy założyć, że $ a>0 $ (zastępując w razie potrzeby $ \phi $ przez $ -\phi $) oraz $ \phi(q_0)<0 $ (przesuwając w razie potrzeby punkt początkowy $ q_0 $ na $ L_0 $).

Połóżmy $ \lambda=\frac{\phi_\ast(q_0)}{\phi(q_0)} $ i niech $ E_\ast=\set{q\in E:\phi_\ast(q)=\lambda \phi(q)} $. Oczywiście $ H\cup\set{q_0}\subset E_\ast $.

Z $ (\smile) $ dla funkcji $ \phi_\ast $ i funkcji $ \lambda \phi $ wynika, że każda prosta w $ E $ zawierająca trzy punkty zbioru $ E_\ast $ zawiera się w $ E_\ast $.

Niech $ L=q_0+\lin(\be) $ będzie prostą taką, że $ Q(\si(\be))>0 $. Z $ (\smile) $ dla $ \phi $ na $ L $ wnioskujemy, że zbiór $ L\cap H $ jest dwupunktowy, a $ q_0\in L\setminus H $ daje wtedy $ L\subset E_\ast $. Pokazaliśmy więc, że $ \set{q_0+\be: Q(\si(\be))>0}\subset E_\ast $.

Weźmy teraz dowolne $ q=q_0+\ga\in E $. Punkty prostej $ L_q=q+\lin(\be_0) $ możemy przedstawić w postaci $ q_0+(\ga+t\be_0) $. Powtarzając uzasadnienie $ (\smile) $ widzimy, że $ Q(\si(\ga+t\be_0))=t^2Q(\si(\be_0))+tb+Q(\si(\ga))>0 $ dla dostatecznie dużych $ t $ (bo $ Q(\si(\be_0))>0 $). Dla takich $ t $ punkty $ q_0+(\ga+t\be_0) $ prostej $ L_q $ są w $ E_\ast $, więc cała prosta $ L_q $ jest w $ E_\ast $ i stąd $ q\in L_q\subset E_\ast $. Mamy więc $ E_\ast=E $, co daje tezę.