Endomorfizmy przestrzeni liniowych

Przekształcenia liniowe przestrzeni liniowych w siebie nazywamy endomorfizmami.

Zauważmy, że wybór układu współrzędnych $ \si:V\to\K^n $ w $ n $-wymiarowej przestrzeni liniowej $ V $ nad $ \K $ prowadzi do izomorfizmu $ \vp\to\MP{\si}{\si}{\vp} $ przestrzeni endomorfizmów $ \ho{V}{V} $ i przestrzeni macierzy $ \M{n}{n}{\K} $, przy czym, przy tym izomorfizmie składaniu endomorfizmów odpowiada mnożenie macierzy. Analizując interesujące nas własności, czasem wygodniej jest rozpatrywać endomorfizmy, a czasem macierze.

Jednym z najważniejszych wyników tego rozdziału jest twierdzenie Jordana, podające klarowny opis struktury endomorfizmów przestrzeni nad ciałem liczb zespolonych. Dowód tego twierdzenia odbiega stopniem trudności od pozostałych rozumowań w skrypcie i choć podajemy go ze szczegółami (wybraliśmy rozumowanie, które prowadzi szybko do celu, ustalając po drodze fakty potrzebne przy zastosowaniach), należy przypomnieć, że nie wchodzi on w zakres materiału obowiązującego w obecnym programie GAL.

Wielomian charakterystyczny, wektory własne

Wielomian charakterystyczny, wektory własne.

Pierwiastki wielomianu charakterystycznego macierzy, który definiujemy poniżej, pozwalają wyznaczać niezerowe wektory przechodzące pod działaniem tej macierzy na wektory proporcjonalne - wektory własne macierzy.

Definicja (#) Wielomianem charakterystycznym macierzy kwadratowej $ A\in\M{n}{n}{\K} $ nazywamy wielomian $ w_A(x)\in\K[x] $ określony wzorem

$$w_A(x)=\det(A-xI_n).$$

Definicja wielomianu charakterystycznego wymaga komentarza. Występujący w niej wzór najprościej można zinterpretować przy pomocy formuły z Twierdzenia [link] opisującej $ \det (A-xI_n) $ jako sumę iloczynów, których pewne czynniki mają postać $ a_{ii}-x $, gdzie $ a_{ii} $ są wyrazami z przekątnej $ A $.

Po wymnożeniu i pogrupowaniu wynika stąd wzór

$$w_A(x)=a_0+a_1(-x)\ldots+a_{n-1}(-x)^{n-1}+(-x)^n$$

pokazujący, że $ w_A(x) $ jest wielomianem. Łatwo zauważyć, że wyraz stały $ a_0 $ jest wyznacznikiem $ A $, zaś współczynnik przy $ (-x)^{n-1} $ jest sumą $ a_{n-1}=\sum_{i=1}^n a_{ii} $ wyrazów stojących na głównej przekątnej $ A $, którą nazywamy śladem macierzy $ A $ i oznaczamy $ \tr A $.

Jeśli $ \K $ jest ciałem nieskończonym (przypomnijmy, że w tym wykładzie najważniejsze są ciała $ \R $ i $ \c $), $ w_A(x) $ można utożsamiać z funkcją przypisującą skalarowi $ \la\in\K $ skalar $ \det (A-\la I_n) $ i w dalszym ciągu traktować będziemy $ w_A(x) $ właśnie w taki sposób - jako funkcję $ w_A:\K\to\K $.

Należy jednak zwrócić uwagę, że nad $ \Z_2 $, wielomian $ \det\left(\mk{cc}{1&0\\0&0}-x\mk{cc}{1&0\\0&1}\right)=-x+x^2\in\Z_2[x] $ określa funkcję tożsamościowo równą zero, a więc nie jest obojętne jak interpretujemy wzór w [link].

Definicja (#) Dla $ A\in\M{n}{n}{\K} $ pierwiastki wielomianu charakterystycznego $ w_A(x) $ nazywamy wartościami własnymi macierzy $ A $, a ich zbiór $ \sp (A)=\set{\la\in\K:w_A(\la)=0} $ - spektrum $ A $.

Wartości własne macierzy $ A\in\M{n}{n}{\K} $ są opisane równaniem $ \det (A-xI_n)=0 $, a więc, zob.\ [link],

$$\la\in\sp(A)\iff N(A-\la I_n)\neq\set{\0}.$$
Definicja (#) Niezerowe wektory z przestrzeni $ N(A-\la I_n) $, tzn.\ niezerowe wektory $ X\in\K^n $ takie, że $ AX=\la X $, nazywamy wektorami własnymi $ A $ $ ( $odpowiadającymi wartości własnej $ \la) $.

Określimy teraz ważną relację równoważności między macierzami kwadratowymi tego samego wymiaru - relację podobieństwa i sprawdzimy, że relacja podobieństwa zachowuje wielomian charakterystyczny.

Definicja (#) Macierze $ A,B\in\M{n}{n}{\K} $ są podobne, jeśli istnieje macierz odwracalna $ C\in\M{n}{n}{\K} $ taka, że $ B=C^{-1}AC $.
Twierdzenie (#) Macierze podobne mają identyczne wielomiany charakterystyczne.
Dowód: Niech $ B=C^{-1}AC $, gdzie $ A,B,C\in\M{n}{n}{\K} $. Należy pokazać, ze funkcje $ w_A $ i $ w_B $ na $ \K $ są identyczne. Istotnie, dla $ \la\in\K $ mamy $ w_B(\la)=\det (B-\la I_n)= \det (C^{-1}AC-\la I_n)= \det (C^{-1}(A-\la I_n)C)= \det C^{-1}\det (A-\la I_n)\det C= w_A(\la) $. □

Jak jednak wyjaśnimy w dalszym ciągu, macierze z identycznym wielomianem charakterystycznym nie muszą być podobne.

Twierdzenie [link], w połączeniu z następną obserwacją, pozwala zdefiniować wielomian charakterystyczny endomorfizmu.

Uwaga (#) Jeśli $ \vp:V\to V $ jest endomorfizmem przestrzeni liniowej $ V $, a $ \si,\ta:V\to \K^n $ są układami współrzędnych w $ V $, to macierze $ \MP{\ta}{\ta}{\vp} $ i $ \MP{\si}{\si}{\vp} $ są podobne.

Istotnie, dla macierzy $ C=M(\ta\circ\si^{-1}) $ zmieniającej współrzędne $ \si(\al) $ wektora $ \al $ na jego współrzędne $ \ta(\al) $, zob.\ Uwaga [link] (c), mamy $ \MP{\si}{\si}{\vp}=M(\si\circ\vp\circ\si^{-1})= M(\si\circ\ta^{-1}\circ\ta\circ\vp\circ\ta^{-1}\circ\ta\circ\si^{-1})= M(\si\circ\ta^{-1})M(\ta\circ\vp\circ\ta^{-1})M(\ta\circ\si^{-1})= C^{-1}\MP{\ta}{\ta}{\vp}C $.

Definicja (#) Wielomianem charakterystycznym endomorfizmu $ \vp:V\to V $ nazywamy wielomian $ w_T(x)=\det(\MP{\si}{\si}{\vp}-xI_n) $, gdzie $ \si:V\to\K^n $ jest dowolnym układem współrzędnych. Wyznacznikiem i śladem endomorfizmu $ \vp $ nazywamy wyraz wolny $ \det\vp=\det\MP{\si}{\si}{\vp} $ i współczynnik $ \tr\vp=\tr\MP{\si}{\si}{\vp} $ tego wielomianu, odpowiednio, a zbiór $ \sp (\vp) $ pierwiastków $ w_T(x) $ nazywamy spektrum endomorfizmu $ \vp $.

Ponieważ $ \ker(\vp-\la\id)=\si^{-1}(N(\MP{\si}{\si}{\vp}-\la I_n)) $, mamy

$$\la\in\sp(\vp)\iff \ker(\vp-\la\id)\neq\set{\0}.$$

Terminologię wprowadzoną w Definicji [link] przenosimy także na przypadek endomorfizmów.

Definicja (#) Dla endomorfizmu $ \vp:V\to V $ niezerowe wektory z $ \ker(\vp-\la\id) $, tzn.\ niezerowe wektory $ \al\in V $ takie, że $ \vp(\al)=\la \al $, nazywamy wektorami własnymi $ \vp $ $ ( $odpowiadającymi wartości własnej \nolinebreak $ \la) $.

Występujące w kolejnej uwadze operacje sumy algebraicznej i sumy prostej skończenie wielu podprzestrzeni przestrzeni liniowej $ V $ są naturalnymi uogólnieniami odpowiednich operacji dla dwóch składników wprowadzonych w Definicjach $ \ref{de:sua2} $ i $ \ref{de:sup2} $.

Uwaga (#) Dla endomorfizmu $ \vp:V\to V $:

  • [(a)] suma wektorów własnych odpowiadających parami różnym wartościom własnym $ \vp $ nie jest wektorem zerowym;
  • [(b)] wektory własne odpowiadające parami różnym wartościom własnym $ \vp $ są liniowo niezależne;
  • [(c)] suma algebraiczna $ \sum_{\la\in\sp(\vp)} \ker(\vp-\la\id) $ jest sumą prostą $ \bigoplus_{\la\in\sp(\vp)} \ker(\vp-\la\id) $.

Zdanie (c) orzeka, że dla dowolnego wyboru $ \al_\la\in\ker(\vp-\la\id) $, $ \la\in\sp(\vp) $, z równości $ \sum_{\la\in\sp(\vp)}\al_\la=\0 $ wynika, że wszystkie $ \al_\la $ są zerowe, a to jest konsekwencją (a). Zdanie (b) również wynika z (a), bo jeśli $ \al_\la $ jest wektorem własnym odpowiadającym wartości własnej $ \la $ i $ a_\la\neq 0 $, to $ a_\la\al_\la $ też jest wektorem własnym odpowiadającym $ \la $.

Własność (a) udowodnimy przez indukcję ze względu na liczbę składników $ k $. Załóżmy (a) dla sum mniej niż $ k $ wektorów własnych $ \vp $ i niech $ \al_j $ będzie wektorem własnym odpowiadającym $ \la_j $, $ j=1,\ldots,k $, gdzie $ \la_1,\ldots,\la_k $ są parami różne. Jeśli $ \sum_{j\leq k}\al_j=\0 $, to $ \0=\vp(\sum_{j\leq k}\al_j)-\la_k(\sum_{j\leq k}\al_j)=\sum_{j<k}(\la_j-\la_k)\al_j $, co \nolinebreak przeczy założeniu indukcyjnemu, bo $ \la_j-\la_k\neq 0 $ dla $ j<k $.

Endomorfizmy, których wektory własne rozpinają całą przestrzeń mają wyjątkowo prostą strukturę. Zgodnie z Uwagą [link] klasę takich endomorfizmów można opisać następująco:

Definicja Endomorfizm $ \vp:V\to V $ jest diagonalizowalny, jeśli $ V=\bigoplus_{\la\in\sp(\vp)} \ker(\vp-\la\id) $.

Macierz $ A\in\M{n}{n}{\K} $ jest diagonalizowalna, jeśli $ A $ jest podobna do macierzy diagonalnej.

Uwaga (#) Diagonalizowalność endomorfizmu $ \vp:V\to V $ oznacza istnienie bazy $ (\al_1,\ldots,\al_n) $ przestrzeni $ V $ złożonej z wektorów własnych $ \vp $ (por.\ Twierdzenie [link]). W układzie współrzędnych $ \si:V\to \K^n $ związanym z tą bazą, macierz $ D=\MP{\si}{\si}{\vp} $ jest diagonalna - jeśli $ \vp(\al_j)=\la_j\al_j $, to $ \la_1,\ldots,\la_n $ stoją na przekątnej $ D $, zob.\ Uwaga [link] (a). W szczególności, wielomian charakterystyczny $ w_\vp(x)=w_D(x)=(\la_{1}-x)\cdot\ldots\cdot(\la_{n}-x) $ ma rozkład na czynniki liniowe, a krotność każdego pierwiastka tego wielomianu jest równa $ \dim[\ker(\vp-\la\id)] $ (te dwa warunki charakteryzują diagonalizowalność $ \vp $, zob.\ Wniosek [link]).

Z Uwagi [link] wynika, że endomorfizm $ \vp $ jest diagonalizowalny wtedy i tylko wtedy, gdy dla dowolnego układu współrzędnych $ \ta:V\to\K^n $ macierz $ \MP{\ta}{\ta}{\vp} $ jest diagonalizowalna.

Najważniejszą klasę endomorfizmów diagonalizowalnych poznamy w części [link] - są to endomorfizmy samosprzężone na przestrzeniach euklidesowych.

Zasadnicze twierdzenie algebry

Warunkiem koniecznym istnienia wektorów własnych jest istnienie pierwiastków wielomianu charakterystycznego. To wskazuje szczególną rolę ciała skalarów $ \c $, bo jak wykażemy poniżej, każdy wielomian o \nolinebreak współczynnikach zespolonych ma pierwiastek zespolony.

Twierdzenie (#) Dla każdego wielomianu $ w\in\c[x] $ stopnia dodatniego istnieje $ \la\in\c $ takie, że $ w(\la)=0 $.

Dowód poprzedzimy dwoma lematami

Lemat {\bf (d'Alemberta).} Niech $ w(z)=a_0+a_1z+\ldots+z^n $, $ a_i\in\c $. Jeśli $ w(a)\neq 0 $, to istnieje $ b\in \c $ takie, że $ |w(b)|<|w(a)| $.
Dowód: Mamy $ w(a+z)=a_0+a_1(a+z)+\ldots+(a+z)^n=A_0+A_1z+\ldots+z^n= w(a)+A_kz^k+\ldots+z^n $, gdzie $ A_k\neq 0 $.

Niech $ c\in\c $ będzie takie, że $ c^k=-\frac{w(a)}{A_k} $ ($ c=\sqrt[k]{r}(\cos\frac{\theta}{k}+i\sin\frac{\theta}{k}) $, jeśli $ -\frac{w(a)}{A_k}={r}(\cos {\theta}+i\sin{\theta}) $, $ r>0 $).

\mDla $ t\in\R $ z przedziału $ [0,1] $,

$$w(a+tc)=w(a)+A_kt^kc^k+\ldots+t^nc^n= w(a)-w(a)t^k+B_{k+1}t^{k+1}\ldots+B_nt^n= w(a)(1-t^k)+B_{k+1}t^{k+1}\ldots+B_nt^n.$$

Tak więc

$ |w(a+tc)|\leq(1-t^k)|w(a)|+t^k(|B_{k+1}|t\ldots+|B_n|t^{n-k})= |w(a)|+t^k(-|w(a)|+|B_{k+1}|t\ldots+|B_n|t^{n-k}). $

Dobierzmy $ t>0 $ tak małe, żeby wyrażenie w nawiasie było ujemne. Wówczas dla $ b=a+tc $ mamy $ |w(b)|<|w(a)| $. □

Lemat (#) Dla wielomianu zespolonego $ w(z)=a_0+a_1z+\ldots+z^n $ i $ K=\set{z\in\c:|\Re z|,|\Im z|\leq M} $ istnieje $ z_0\in K $ takie, że $ |w(z_0)|= \inf\set{|w(z)|: z\in K} $.

Lemat jest wersją twierdzenia Weierstrassa dla funkcji $ |w(z)| $ na kwadracie $ K $, jego uzasadnienie podamy w \nolinebreak uzupełnieniach, zob.\ Lemat [link]. Z tych dwóch lematów łatwo wyprowadzimy teraz zasadnicze twierdzenie algebry.

{\bf Dowód Twierdzenia [link].} Niech $ w(z)=a_0+a_1z+\ldots+z^n $ będzie wielomianem zespolonym. Ponieważ

$$|w(z)|= \left|z^n\left(\frac{a_0}{z^n}+ \ldots+\frac{a_{n-1}}{z}+1\right)\right|\geq |z^n|\left(1-\left(\frac{|a_0|}{|z^n|}+ \ldots+\frac{|a_{n-1}|}{|z|}\right)\right),$$

dla pewnego kwadratu $ K $ o środku w zerze i dostatecznie dużym boku, $ \mu=\inf\set{|w(z)|: z\in \c}=\inf\set{|w(z)|: z\in K} $. Z Lematu [link] istnieje $ z_0\in K $ takie, że $ |w(z_0)|=\mu $, a z Lematu d'Alemberta $ \mu=0 $. {\null\null
$ \blacksquare $    }

Twierdzenie Jordana

Głównym celem tej części jest możliwie przejrzysty opis endomorfizmów przestrzeni liniowych nad ciałem liczb zespolonych. W języku macierzowym, pokażemy, że każda macierz z $ \M{n}{n}{\c} $ jest podobna do macierzy o szczególnie prostej postaci - macierzy zbudowanej z klatek Jordana.

Nasze rozważania podzielimy na dwie części. W pierwszej, nie nakładając na ciało żadnych ograniczeń, wyjaśnimy strukturę endomorfizmów, których pewna potęga jest zerem - endomorfizmów nilpotentnych. W drugiej ograniczymy się do przestrzeni nad ciałem liczb zespolonych i wykorzystamy zasadnicze twierdzenie algebry [link] - w \nolinebreak połączeniu z wcześniejszą analizą endomorfizmów nilpotentnych, to łatwo doprowadzi do celu.

\m{\bf (A) Struktura endomorfizmów nilpotentnych.}

Niech $ \vp:V\to V $ będzie endomorfizmem przestrzeni liniowej nad dowolnym ciałem $ K $.

Układ wektorów $ (\al,\vp(\al),\ldots,\vp^{k-1}(\al)) $ w $ V $ taki, że $ \vp^{k-1}(\al)\neq\0 $ i $ \vp^{k}(\al)=\0 $ będziemy nazywali \mbox{$ \vp $-serią} o początku $ \al $ i wysokości $ k $.

Przestrzeń $ \ub{\al}=\lin(\al,\vp(\al),\ldots,\vp^{k-1}(\al)) $ jest niezmiennicza dla \nolinebreak $ \vp $ (to \nolinebreak znaczy $ \vp\ub{\al}\subset\ub{\al} $) i seria $ (\al,\vp(\al),\ldots,\vp^{k-1}(\al)) $ jest bazą $ \ub{\al} $: jeśli $ \sum_{j=0}^{k-1} a_j\vp^{j}(\al)=\0 $, gdzie $ \vp^0=\nolinebreak\id $, to kolejno działając na \nolinebreak obie strony tej równości endomorfizmami $ \vp^{k-1},\vp^{k-2},\ldots,\vp^0 $, wnosimy, że $ a_0=\nolinebreak 0,a_1=\nolinebreak 0,\ldots,a_{k-1}=0 $.

Ponieważ $ \vp(\vp^j(\al))=\vp^{j+1}(\al) $, w układzie współrzędnych $ \si:\ub{\al}\to\K^k $ związanym z $ \vp $-serią o początku $ \al $ macierz obcięcia $ \vp $ do $ \ub{\al} $ ma bardzo prostą postać

$$\MP{\si}{\si}{\vp}=\mk{cccc} {0&&&0\vspace{-2pt}\\1&\ddots&&\vspace{-2pt}\\&\ddots&\ddots&\\0&&1&0\\} \in\M{k}{k}{\K}\ ;$$

jest to klatka Jordana $ J_k(0) $.

Twierdzenie

(#) Niech $ \vp:V\to V $ będzie endomorfizmem takim, że $ \vp^m=\0 $. Istnieją wówczas skończone (niektóre być może puste) zbiory wektorów $ F_k\subset V $, $ k=1,\ldots,m $ takie, że każde $ \al\in F_k $ jest początkiem $ \vp $-serii o wysokości $ k $ oraz

$ (\ast) $ $ V=\bigoplus_{k\leq m}(\bigoplus_{\al\in F_k}\ub{\al}). $

Przy tym, dla $ k\leq m $ mamy

$ (\ast\ast) $ $ |F_k|=\r\vp^{k-1}-2\,\r\vp^{k}+\r\vp^{k+1} $.

Dowód:{\bf $ ^\ast $}\ Połóżmy $ W_k=\ker\vp^k $ dla $ k\geq 0 $ i rozważmy łańcuch $ \set{\0}=W_0\subset W_1\subset\ldots W_{m-1}\subset W_m=\nolinebreak V $ podprzestrzeni $ V $. Endomorfizm $ \vp $ przeprowadza $ W_{k+1} $ w $ W_{k} $, więc korzystając z Wniosku $ \ref{wn:dopo} $, znajdziemy

(być może zerową) podprzestrzeń $ U_k\subset W_k $ taką, że

$ (\dag) $ $ W_k=(W_{k-1}+\vp(W_{k+1}))\oplus U_k $ dla $ k= 1,\ldots,m $.

Dla niezerowych przestrzeni $ U_k $ definiujemy $ F_k $ jako zbiór wektorów ustalonej bazy $ U_k $ i kładziemy $ F_k=\emptyset $ jeśli $ U_k $ jest zerowa.

Przyjmując $ \ub{U_k}=U_k+\vp(U_k)+\ldots+\vp^{k-1}(U_k) $, zauważmy, że dla $ k=m,m-1,\ldots,1 $

$$V=W_{k-1}+\ub{U_k}+\ub{U_{k+1}}+\ldots+\ub{U_m}.$$

Istotnie, dla $ k=m $ równość wynika z warunku $ (\dag) $, bo $ W_{m+1}=W_m=V $ i $ \vp(W_m)\subset W_{m-1} $. Załóżmy, że $ V=W_{k}+\ub{U_{k+1}}+\ldots+\ub{U_m} $. Wtedy $ \vp(V)\subset\vp(W_{k})+\ub{U_{k+1}}+\ldots+\ub{U_m}\subset W_{k-1}+\ub{U_{k+1}}+\nolinebreak \ldots+\nolinebreak \ub{U_m} $, więc, odwołując się znowu do $ (\dag) $, mamy $ V=(W_{k-1}+\vp(W_{k+1})+U_k)+\ub{U_{k+1}}+\ldots+\ub{U_m}\subset W_{k-1}+\nolinebreak \vp(V)+U_k+\ub{U_{k+1}}+\ldots+\ub{U_m}\subset W_{k-1}+\ub{U_k}+\ub{U_{k+1}}+\ldots+\ub{U_m} $.

W szczególności, $ V $ jest sumą algebraiczną podprzestrzeni $ \ub{U_k} $, $ k\leq m $. Ponieważ $ \ub{U_k} $ jest sumą algebraiczną podprzestrzeni $ \ub{\al} $, $ \al\in F_k $, wynika stąd, że $ V $ jest sumą algebraiczną podprzestrzeni $ \ub{\al} $, $ \al\in \bigcup_{k\leq m} F_k $. To, że jak orzeka $ (\ast) $, jest to suma prosta, wywnioskujemy z \nolinebreak własności $ (\ast\ast) $, do \nolinebreak uzasadnienia której teraz przejdziemy.

Ustalmy $ k\leq m $. Jeśli dla $ \ga\in U_{k} $ i $ \be\in \vp(W_{k+1}) $, mamy $ \vp^{k-1}(\ga)=\vp^{k-1}(\be) $, to $ \be-\ga\in \ker\vp^{k-1}=W_{k-1} $ i zgodnie z $ (\dag) $, z tożsamości $ \0=[(\be-\ga)-\be]+\ga $ wynika $ \ga=\0 $. Ponieważ $ \vp^{k-1} $ zeruje się na $ W_{k-1} $, stąd i z $ (\dag) $ otrzymujemy $ \vp^{k-1}(W_k)=\vp^{k-1}(\vp(W_{k+1}))\oplus \vp^{k-1}(U_k) $, a ponieważ obcięcie $ \vp^{k-1}|U_k $ jest izomorfizmem, zob.\ $ (\dag) $, mamy $ |F_k|=\dim U_k=\r(\vp^{k-1}|U_k)=\r (\vp^{k-1}|W_k)-\r(\vp^{k}|W_{k+1}) $. Z Twierdzenia [link] dostajemy

$ \r (\vp^{k-1}|W_k)=\dim W_k-\d (\vp^{k-1}|W_k)=\d \vp^{k}-\d \vp^{k-1}=\r \vp^{k-1}-\r \vp^{k} $, a \nolinebreak stąd $ |F_k|= (\r \vp^{k-1}-\r \vp^{k}) - (\r \vp^{k}-\r \vp^{k+1}) $, czyli $ (\ast\ast) $.

Ponieważ, jak zauważyliśmy $ V $ jest sumą algebraiczną przestrzeni $ \ub{\al} $, $ \al\in \bigcup_{k\leq m} F_k $, dla uzasadnienia $ (\ast) $ pozostaje wyprowadzić z $ (\ast\ast) $, że suma wymiarów takich $ \ub{\al} $ jest równa $ \dim V $, zob.\ Wniosek [link].

Dla uproszczenia oznaczeń, przyjmujemy $ r_j=\r \vp^j $ i zauważmy, że $ r_0=\dim V $, $ r_m=r_{m+1}=0 $. Każdy wektor $ \al\in F_k $ jest początkiem $ \vp $-serii wysokości $ k $, zob.\ $ (\dag) $, więc suma wymiarów przestrzeni $ \ub{\al} $, \nolinebreak $ \al\in \nolinebreak \bigcup_{k\leq m} F_k $ jest równa

$ \sum_{k=1}^m k|F_k|=\sum_{k=1}^m k(r_{k-1}-2r_k+r_{k+1})=r_0-2r_1+2r_1+\sum_{k=2}^{m-1}(k+1)r_k-2kr_k+(k-1)r_k= r_0, $

co kończy dowód twierdzenia. □

Twierdzenie [link] uzupełnimy obserwacją, z której skorzystamy w dowodzie twierdzenia Jordana.

Lemat (#) Dla endomorfizmu $ \vp:V\to V $ i wartości własnej $ \la\in\sp(\vp) $ istnieje $ m\geq 1 $ takie, że

$ V=\ker[(\vp-\la\id)^m]\oplus\im[(\vp-\la\id)^m], $

przy czym, jeśli $ \mu\neq \la $, $ k\geq 1 $, to $ \ker[(\vp-\mu\id)^k]\subset \im[(\vp-\la\id)^m] $.

Dowód: Połóżmy $ \ps=\vp-\la\id $. Ponieważ $ \dim V $ jest skończony, łańcuch $ \set{\0}\neq\ker\ps\subset\ker\ps^2\subset\ldots $ musi się stabilizować, tzn.\ dla pewnego $ m\geq 1 $ mamy $ \ker\ps^m=\ker\ps^{m+1}=\ldots $ .

Jeśli $ \be=\ps^m(\al) $ oraz $ \ps^m(\be)=\0 $, to $ \ps^{2m}(\al)=\0 $, stąd $ \ps^{m}(\al)=\0 $ i $ \be=\0 $.

To pokazuje, że część wspólna $ \ker\ps^m\cap\im\ps^m $ jest przestrzenią zerową, a ponieważ suma wymiarów tych przestrzeni jest równa $ \d\ps^m+\r\ps^m=\dim V $, otrzymujemy pierwszą część tezy.

Dla dowodu drugiej części

połóżmy dodatkowo $ W=\ker[(\vp-\mu\id)^k] $. Dla $ \al\in W $, z przemienności endomorfizmów $ \ps=(\vp-\la\id) $ i $ (\vp-\mu\id) $ wynika, że $ \ps(\al)\in W $. Ponadto warunek $ \al\in W\cap \ker\ps $ implikuje $ \al=\0 $. Istotnie, $ \al\in\ker\ps $ oznacza $ \vp(\al)=\la\al $, więc $ (\vp-\mu\id)(\al)=(\la-\mu)\al $, a stąd $ (\vp-\mu\id)^k(\al)=(\la-\mu)^k\al $ i z $ \al\in W $ wynika wtedy $ \al=\0 $. Tak więc obcięcie $ \ps|W:W\to W $ jest izomorfizmem, a zatem $ W=\ps^m(W)\subset \im[(\vp-\la\id)^m] $. □

\m {\bf (B) Twierdzenie Jordana i postać Jordana macierzy.}

Z zasadniczego twierdzenia algebry

i z Lematu [link] wyprowadzimy teraz

Twierdzenie (#) Jeśli $ \vp:V\to V $ jest endomorfizmem przestrzeni liniowej $ V $ nad $ \c $, to dla każdej wartości własnej $ \la\in\sp(\vp) $ istnieje $ m_\la\geq 1 $ takie, że

$$V=\bigoplus_{\la\in\sp(\vp)}\ker[(\vp-\la\id)^{m_\la}].$$
Dowód: Dowód przeprowadzimy indukcyjnie ze względu na wymiar przestrzeni. Załóżmy, że twierdzenie jest prawdziwe dla przestrzeni wymiaru mniejszego niż $ \dim V $. Z zasadniczego twierdzenia algebry istnieje $ \la\in\sp(\vp) $. Wówczas $ \ker(\vp-\la\id)\neq\set{\0} $ i z Lematu [link] mamy $ V=\ker[(\vp-\la\id)^{m_{\la}}]\oplus \im[(\vp-\la\id)^{m_{\la}}] $ dla pewnego $ m_{\la}\geq 1 $.

Przyjmijmy $ U=\im[(\vp-\la\id)^{m_{\la}}] $. Mamy $ \dim U<\dim V $ i endomorfizm $ \vp $ przeprowadza $ U $ w siebie. Założenie indukcyjne dla obcięcia $ \vp|U $ daje więc rozkład $ U=\bigoplus_{\mu\in\sp(\vp|U)}\ker[(\vp|U-\mu\id)^{m_{\mu}}] $ dla pewnych $ m_\mu\geq 1 $, $ \mu\in\sp(\vp|U) $. Z drugiej części Lematu [link] wynika, że $ \ker[(\vp|U-\mu\id)^{m_{\mu}}]=\ker[(\vp-\mu\id)^{m_{\mu}}] $ dla $ \mu\in\sp(\vp|U) $ i $ \sp(\vp|U)=\sp(\vp)\setminus\set{\la} $, a to już daje tezę. □

Uwaga (#) Jeśli $ \vp:V\to V $ i $ m_\la $ dla $ \la\in\sp(\vp) $ są takie jak w Twierdzeniu [link], to dla każdego $ \la\in\sp(\vp) $ obcięcie $ \vp|\ker[(\vp-\la\id)^{m_\la}] $ jest endomorfizmem nilpotentnym $ \ker[(\vp-\la\id)^{m_\la}] $, więc zgodnie z Twierdzeniem [link], istnieją skończone (niektóre być może puste) zbiory wektorów $ F_k^\la\subset V $, $ k=1,\ldots,m_\la $ takie, że każde $ \al\in F_k^\la $ jest początkiem $ (\vp-\la\id) $-serii o wysokości $ k $ oraz

$ (\ast) $ $ \ker[(\vp-\la\id)^{m_\la}]=\bigoplus_{k\leq m_\la}(\bigoplus_{\al\in F_k^\la}\ub{\al}). $

Przy tym dla $ k\leq m_\la $,

$ (\ast\ast) $ $ |F_k^\la|=\r[(\vp-\la\id)^{k-1}]-2\,\r[(\vp-\la\id)^{k}]+\r[(\vp-\la\id)^{k+1}] $.

Ustalmy $ \al\in F_k^\la $, rozpatrzmy $ (\vp-\la\id) $-serię $ \al_1=\al $, $ \al_2=(\vp-\la\id)(\al_1),\ldots,\al_k=(\vp-\la\id)^{k-1}(\al_{k-1}) $ i \nolinebreak niech $ \si_\al:\ub{\al}\to \c^k $ będzie układem współrzędnych związanym z tą serią.

Ponieważ $ \vp(\al_j)=(\vp-\la\id)(\al_j)+\la\al_j=\al_{j+1}+\la\al_j $, macierz endomorfizmu $ \vp|\ub{\al}:\ub{\al}\to \ub{\al} $ w układzie współrzędnych $ \si_\al $ jest klatką Jordana

$$J_k(\la)=\mk{cccc}  {\la&&&0\vspace{-2pt}\\  1&\ddots&&\vspace{-2pt}\\  &\ddots&\ddots&\\0&&1&\la\\}\in\M{k}{k}{\c} \ .$$

Tak więc, w układzie współrzędnych $ \si_\la $ na $ \ker[(\vp-\la\id)^{m_\la}] $, który na $ \ub{\al} $ pokrywa się z $ \si_\al $, macierz $ \MP{\si_\la}{\si_\la}{\vp|\ker[(\vp-\la\id)^{m_\la}} $ jest zbudowana z klatek Jordana $ J_k(\la) $ na przekątnej, przy czym liczba $ |F_k^\la| $ klatek $ J_k(\la) $ jest opisana wzorem $ (\ast\ast) $.

Łącząc układy współrzędnych $ \si_\la $ na składnikach rozkładu z Twierdzenia [link], dostajemy układ współrzędnych $ \si:V\to\c^n $, w którym macierz $ \MP{\si}{\si}{\vp} $ endomorfizmu $ \vp $ jest zbudowana z klatek Jordana $ J_k(\la) $, $ \la\in\sp(\vp) $, przy czym liczba klatek $ J_k(\la) $ jest opisana wzorem $ (\ast\ast) $.

Bazę wyznaczającą układ współrzędnych $ \si $ w Uwadze [link] będziemy nazywać bazą Jordana dla $ \vp $. Baza Jordana jest złożona z $ (\vp-\la\id) $-serii generujących składniki rozkładów $ (\ast) $ dla $ \la\in\sp(\vp) $.

Macierz zbudowaną z klatek Jordana leżących na jej przekątnej nazywać będziemy macierzą Jordana. W języku macierzowym, nasze ustalenia można sformułować w postaci wniosku:

Stwierdzenie Każda macierz $ A\in\M{n}{n}{\c} $ jest podobna do macierzy w postaci Jordana. Dokładniej, istnieje macierz odwracalna $ C\in\M{n}{n}{\c} $ taka, że

$$C^{-1}AC=\mk{ccc}  {J_1&&\0\vspace{-2pt}\\  &\ddots&\vspace{-2pt}\\  \0&&J_s} \ ,$$

gdzie każda macierz $ J_l $ jest klatką Jordana $ J_k(\la) $ dla pewnego $ \la\in\sp(A) $, a liczba klatek $ J_k(\la) $ jest dana wzorem

$ \r[(A-\la I_n)^{k-1}]- 2\,\r[(A-\la I_n)^{k}]+ \r[(A-\la I_n)^{k+1}] $. W szczególności, macierz Jordana podobna do $ A $ jest wyznaczona jednoznacznie z dokładnością do kolejności klatek Jordana.

Dowód: Z Uwagi [link] zastosowanej do endomorfizmu $ \vp_A:\c^n\to\c^n $ danego wzorem $ T_A(Z)=\nolinebreak AZ $

wynika, że istnieje układ współrzędnych $ \si:\c^n\to\c^n $ taki, że $ \MP{\si}{\si}{\vp_A}= M(\si\circ\vp_A\circ\si^{-1})=M(\si)AM(\si^{-1}) $ jest macierzą Jordana. Jako $ C $ wystarczy więc przyjąć macierz $ M(\si^{-1}) $. □