Twierdzenie Jordana

Głównym celem tej części jest możliwie przejrzysty opis endomorfizmów przestrzeni liniowych nad ciałem liczb zespolonych. W języku macierzowym, pokażemy, że każda macierz z $ \M{n}{n}{\c} $ jest podobna do macierzy o szczególnie prostej postaci - macierzy zbudowanej z klatek Jordana.

Nasze rozważania podzielimy na dwie części. W pierwszej, nie nakładając na ciało żadnych ograniczeń, wyjaśnimy strukturę endomorfizmów, których pewna potęga jest zerem - endomorfizmów nilpotentnych. W drugiej ograniczymy się do przestrzeni nad ciałem liczb zespolonych i wykorzystamy zasadnicze twierdzenie algebry [link] - w \nolinebreak połączeniu z wcześniejszą analizą endomorfizmów nilpotentnych, to łatwo doprowadzi do celu.

\m{\bf (A) Struktura endomorfizmów nilpotentnych.}

Niech $ \vp:V\to V $ będzie endomorfizmem przestrzeni liniowej nad dowolnym ciałem $ K $.

Układ wektorów $ (\al,\vp(\al),\ldots,\vp^{k-1}(\al)) $ w $ V $ taki, że $ \vp^{k-1}(\al)\neq\0 $ i $ \vp^{k}(\al)=\0 $ będziemy nazywali \mbox{$ \vp $-serią} o początku $ \al $ i wysokości $ k $.

Przestrzeń $ \ub{\al}=\lin(\al,\vp(\al),\ldots,\vp^{k-1}(\al)) $ jest niezmiennicza dla \nolinebreak $ \vp $ (to \nolinebreak znaczy $ \vp\ub{\al}\subset\ub{\al} $) i seria $ (\al,\vp(\al),\ldots,\vp^{k-1}(\al)) $ jest bazą $ \ub{\al} $: jeśli $ \sum_{j=0}^{k-1} a_j\vp^{j}(\al)=\0 $, gdzie $ \vp^0=\nolinebreak\id $, to kolejno działając na \nolinebreak obie strony tej równości endomorfizmami $ \vp^{k-1},\vp^{k-2},\ldots,\vp^0 $, wnosimy, że $ a_0=\nolinebreak 0,a_1=\nolinebreak 0,\ldots,a_{k-1}=0 $.

Ponieważ $ \vp(\vp^j(\al))=\vp^{j+1}(\al) $, w układzie współrzędnych $ \si:\ub{\al}\to\K^k $ związanym z $ \vp $-serią o początku $ \al $ macierz obcięcia $ \vp $ do $ \ub{\al} $ ma bardzo prostą postać

$$\MP{\si}{\si}{\vp}=\mk{cccc} {0&&&0\vspace{-2pt}\\1&\ddots&&\vspace{-2pt}\\&\ddots&\ddots&\\0&&1&0\\} \in\M{k}{k}{\K}\ ;$$

jest to klatka Jordana $ J_k(0) $.

Twierdzenie

(#) Niech $ \vp:V\to V $ będzie endomorfizmem takim, że $ \vp^m=\0 $. Istnieją wówczas skończone (niektóre być może puste) zbiory wektorów $ F_k\subset V $, $ k=1,\ldots,m $ takie, że każde $ \al\in F_k $ jest początkiem $ \vp $-serii o wysokości $ k $ oraz

$ (\ast) $ $ V=\bigoplus_{k\leq m}(\bigoplus_{\al\in F_k}\ub{\al}). $

Przy tym, dla $ k\leq m $ mamy

$ (\ast\ast) $ $ |F_k|=\r\vp^{k-1}-2\,\r\vp^{k}+\r\vp^{k+1} $.

Dowód:{\bf $ ^\ast $}\ Połóżmy $ W_k=\ker\vp^k $ dla $ k\geq 0 $ i rozważmy łańcuch $ \set{\0}=W_0\subset W_1\subset\ldots W_{m-1}\subset W_m=\nolinebreak V $ podprzestrzeni $ V $. Endomorfizm $ \vp $ przeprowadza $ W_{k+1} $ w $ W_{k} $, więc korzystając z Wniosku $ \ref{wn:dopo} $, znajdziemy

(być może zerową) podprzestrzeń $ U_k\subset W_k $ taką, że

$ (\dag) $ $ W_k=(W_{k-1}+\vp(W_{k+1}))\oplus U_k $ dla $ k= 1,\ldots,m $.

Dla niezerowych przestrzeni $ U_k $ definiujemy $ F_k $ jako zbiór wektorów ustalonej bazy $ U_k $ i kładziemy $ F_k=\emptyset $ jeśli $ U_k $ jest zerowa.

Przyjmując $ \ub{U_k}=U_k+\vp(U_k)+\ldots+\vp^{k-1}(U_k) $, zauważmy, że dla $ k=m,m-1,\ldots,1 $

$$V=W_{k-1}+\ub{U_k}+\ub{U_{k+1}}+\ldots+\ub{U_m}.$$

Istotnie, dla $ k=m $ równość wynika z warunku $ (\dag) $, bo $ W_{m+1}=W_m=V $ i $ \vp(W_m)\subset W_{m-1} $. Załóżmy, że $ V=W_{k}+\ub{U_{k+1}}+\ldots+\ub{U_m} $. Wtedy $ \vp(V)\subset\vp(W_{k})+\ub{U_{k+1}}+\ldots+\ub{U_m}\subset W_{k-1}+\ub{U_{k+1}}+\nolinebreak \ldots+\nolinebreak \ub{U_m} $, więc, odwołując się znowu do $ (\dag) $, mamy $ V=(W_{k-1}+\vp(W_{k+1})+U_k)+\ub{U_{k+1}}+\ldots+\ub{U_m}\subset W_{k-1}+\nolinebreak \vp(V)+U_k+\ub{U_{k+1}}+\ldots+\ub{U_m}\subset W_{k-1}+\ub{U_k}+\ub{U_{k+1}}+\ldots+\ub{U_m} $.

W szczególności, $ V $ jest sumą algebraiczną podprzestrzeni $ \ub{U_k} $, $ k\leq m $. Ponieważ $ \ub{U_k} $ jest sumą algebraiczną podprzestrzeni $ \ub{\al} $, $ \al\in F_k $, wynika stąd, że $ V $ jest sumą algebraiczną podprzestrzeni $ \ub{\al} $, $ \al\in \bigcup_{k\leq m} F_k $. To, że jak orzeka $ (\ast) $, jest to suma prosta, wywnioskujemy z \nolinebreak własności $ (\ast\ast) $, do \nolinebreak uzasadnienia której teraz przejdziemy.

Ustalmy $ k\leq m $. Jeśli dla $ \ga\in U_{k} $ i $ \be\in \vp(W_{k+1}) $, mamy $ \vp^{k-1}(\ga)=\vp^{k-1}(\be) $, to $ \be-\ga\in \ker\vp^{k-1}=W_{k-1} $ i zgodnie z $ (\dag) $, z tożsamości $ \0=[(\be-\ga)-\be]+\ga $ wynika $ \ga=\0 $. Ponieważ $ \vp^{k-1} $ zeruje się na $ W_{k-1} $, stąd i z $ (\dag) $ otrzymujemy $ \vp^{k-1}(W_k)=\vp^{k-1}(\vp(W_{k+1}))\oplus \vp^{k-1}(U_k) $, a ponieważ obcięcie $ \vp^{k-1}|U_k $ jest izomorfizmem, zob.\ $ (\dag) $, mamy $ |F_k|=\dim U_k=\r(\vp^{k-1}|U_k)=\r (\vp^{k-1}|W_k)-\r(\vp^{k}|W_{k+1}) $. Z Twierdzenia [link] dostajemy

$ \r (\vp^{k-1}|W_k)=\dim W_k-\d (\vp^{k-1}|W_k)=\d \vp^{k}-\d \vp^{k-1}=\r \vp^{k-1}-\r \vp^{k} $, a \nolinebreak stąd $ |F_k|= (\r \vp^{k-1}-\r \vp^{k}) - (\r \vp^{k}-\r \vp^{k+1}) $, czyli $ (\ast\ast) $.

Ponieważ, jak zauważyliśmy $ V $ jest sumą algebraiczną przestrzeni $ \ub{\al} $, $ \al\in \bigcup_{k\leq m} F_k $, dla uzasadnienia $ (\ast) $ pozostaje wyprowadzić z $ (\ast\ast) $, że suma wymiarów takich $ \ub{\al} $ jest równa $ \dim V $, zob.\ Wniosek [link].

Dla uproszczenia oznaczeń, przyjmujemy $ r_j=\r \vp^j $ i zauważmy, że $ r_0=\dim V $, $ r_m=r_{m+1}=0 $. Każdy wektor $ \al\in F_k $ jest początkiem $ \vp $-serii wysokości $ k $, zob.\ $ (\dag) $, więc suma wymiarów przestrzeni $ \ub{\al} $, \nolinebreak $ \al\in \nolinebreak \bigcup_{k\leq m} F_k $ jest równa

$ \sum_{k=1}^m k|F_k|=\sum_{k=1}^m k(r_{k-1}-2r_k+r_{k+1})=r_0-2r_1+2r_1+\sum_{k=2}^{m-1}(k+1)r_k-2kr_k+(k-1)r_k= r_0, $

co kończy dowód twierdzenia. □

Twierdzenie [link] uzupełnimy obserwacją, z której skorzystamy w dowodzie twierdzenia Jordana.

Lemat (#) Dla endomorfizmu $ \vp:V\to V $ i wartości własnej $ \la\in\sp(\vp) $ istnieje $ m\geq 1 $ takie, że

$ V=\ker[(\vp-\la\id)^m]\oplus\im[(\vp-\la\id)^m], $

przy czym, jeśli $ \mu\neq \la $, $ k\geq 1 $, to $ \ker[(\vp-\mu\id)^k]\subset \im[(\vp-\la\id)^m] $.

Dowód: Połóżmy $ \ps=\vp-\la\id $. Ponieważ $ \dim V $ jest skończony, łańcuch $ \set{\0}\neq\ker\ps\subset\ker\ps^2\subset\ldots $ musi się stabilizować, tzn.\ dla pewnego $ m\geq 1 $ mamy $ \ker\ps^m=\ker\ps^{m+1}=\ldots $ .

Jeśli $ \be=\ps^m(\al) $ oraz $ \ps^m(\be)=\0 $, to $ \ps^{2m}(\al)=\0 $, stąd $ \ps^{m}(\al)=\0 $ i $ \be=\0 $.

To pokazuje, że część wspólna $ \ker\ps^m\cap\im\ps^m $ jest przestrzenią zerową, a ponieważ suma wymiarów tych przestrzeni jest równa $ \d\ps^m+\r\ps^m=\dim V $, otrzymujemy pierwszą część tezy.

Dla dowodu drugiej części

połóżmy dodatkowo $ W=\ker[(\vp-\mu\id)^k] $. Dla $ \al\in W $, z przemienności endomorfizmów $ \ps=(\vp-\la\id) $ i $ (\vp-\mu\id) $ wynika, że $ \ps(\al)\in W $. Ponadto warunek $ \al\in W\cap \ker\ps $ implikuje $ \al=\0 $. Istotnie, $ \al\in\ker\ps $ oznacza $ \vp(\al)=\la\al $, więc $ (\vp-\mu\id)(\al)=(\la-\mu)\al $, a stąd $ (\vp-\mu\id)^k(\al)=(\la-\mu)^k\al $ i z $ \al\in W $ wynika wtedy $ \al=\0 $. Tak więc obcięcie $ \ps|W:W\to W $ jest izomorfizmem, a zatem $ W=\ps^m(W)\subset \im[(\vp-\la\id)^m] $. □

\m {\bf (B) Twierdzenie Jordana i postać Jordana macierzy.}

Z zasadniczego twierdzenia algebry

i z Lematu [link] wyprowadzimy teraz

Twierdzenie (#) Jeśli $ \vp:V\to V $ jest endomorfizmem przestrzeni liniowej $ V $ nad $ \c $, to dla każdej wartości własnej $ \la\in\sp(\vp) $ istnieje $ m_\la\geq 1 $ takie, że

$$V=\bigoplus_{\la\in\sp(\vp)}\ker[(\vp-\la\id)^{m_\la}].$$
Dowód: Dowód przeprowadzimy indukcyjnie ze względu na wymiar przestrzeni. Załóżmy, że twierdzenie jest prawdziwe dla przestrzeni wymiaru mniejszego niż $ \dim V $. Z zasadniczego twierdzenia algebry istnieje $ \la\in\sp(\vp) $. Wówczas $ \ker(\vp-\la\id)\neq\set{\0} $ i z Lematu [link] mamy $ V=\ker[(\vp-\la\id)^{m_{\la}}]\oplus \im[(\vp-\la\id)^{m_{\la}}] $ dla pewnego $ m_{\la}\geq 1 $.

Przyjmijmy $ U=\im[(\vp-\la\id)^{m_{\la}}] $. Mamy $ \dim U<\dim V $ i endomorfizm $ \vp $ przeprowadza $ U $ w siebie. Założenie indukcyjne dla obcięcia $ \vp|U $ daje więc rozkład $ U=\bigoplus_{\mu\in\sp(\vp|U)}\ker[(\vp|U-\mu\id)^{m_{\mu}}] $ dla pewnych $ m_\mu\geq 1 $, $ \mu\in\sp(\vp|U) $. Z drugiej części Lematu [link] wynika, że $ \ker[(\vp|U-\mu\id)^{m_{\mu}}]=\ker[(\vp-\mu\id)^{m_{\mu}}] $ dla $ \mu\in\sp(\vp|U) $ i $ \sp(\vp|U)=\sp(\vp)\setminus\set{\la} $, a to już daje tezę. □

Uwaga (#) Jeśli $ \vp:V\to V $ i $ m_\la $ dla $ \la\in\sp(\vp) $ są takie jak w Twierdzeniu [link], to dla każdego $ \la\in\sp(\vp) $ obcięcie $ \vp|\ker[(\vp-\la\id)^{m_\la}] $ jest endomorfizmem nilpotentnym $ \ker[(\vp-\la\id)^{m_\la}] $, więc zgodnie z Twierdzeniem [link], istnieją skończone (niektóre być może puste) zbiory wektorów $ F_k^\la\subset V $, $ k=1,\ldots,m_\la $ takie, że każde $ \al\in F_k^\la $ jest początkiem $ (\vp-\la\id) $-serii o wysokości $ k $ oraz

$ (\ast) $ $ \ker[(\vp-\la\id)^{m_\la}]=\bigoplus_{k\leq m_\la}(\bigoplus_{\al\in F_k^\la}\ub{\al}). $

Przy tym dla $ k\leq m_\la $,

$ (\ast\ast) $ $ |F_k^\la|=\r[(\vp-\la\id)^{k-1}]-2\,\r[(\vp-\la\id)^{k}]+\r[(\vp-\la\id)^{k+1}] $.

Ustalmy $ \al\in F_k^\la $, rozpatrzmy $ (\vp-\la\id) $-serię $ \al_1=\al $, $ \al_2=(\vp-\la\id)(\al_1),\ldots,\al_k=(\vp-\la\id)^{k-1}(\al_{k-1}) $ i \nolinebreak niech $ \si_\al:\ub{\al}\to \c^k $ będzie układem współrzędnych związanym z tą serią.

Ponieważ $ \vp(\al_j)=(\vp-\la\id)(\al_j)+\la\al_j=\al_{j+1}+\la\al_j $, macierz endomorfizmu $ \vp|\ub{\al}:\ub{\al}\to \ub{\al} $ w układzie współrzędnych $ \si_\al $ jest klatką Jordana

$$J_k(\la)=\mk{cccc}  {\la&&&0\vspace{-2pt}\\  1&\ddots&&\vspace{-2pt}\\  &\ddots&\ddots&\\0&&1&\la\\}\in\M{k}{k}{\c} \ .$$

Tak więc, w układzie współrzędnych $ \si_\la $ na $ \ker[(\vp-\la\id)^{m_\la}] $, który na $ \ub{\al} $ pokrywa się z $ \si_\al $, macierz $ \MP{\si_\la}{\si_\la}{\vp|\ker[(\vp-\la\id)^{m_\la}} $ jest zbudowana z klatek Jordana $ J_k(\la) $ na przekątnej, przy czym liczba $ |F_k^\la| $ klatek $ J_k(\la) $ jest opisana wzorem $ (\ast\ast) $.

Łącząc układy współrzędnych $ \si_\la $ na składnikach rozkładu z Twierdzenia [link], dostajemy układ współrzędnych $ \si:V\to\c^n $, w którym macierz $ \MP{\si}{\si}{\vp} $ endomorfizmu $ \vp $ jest zbudowana z klatek Jordana $ J_k(\la) $, $ \la\in\sp(\vp) $, przy czym liczba klatek $ J_k(\la) $ jest opisana wzorem $ (\ast\ast) $.

Bazę wyznaczającą układ współrzędnych $ \si $ w Uwadze [link] będziemy nazywać bazą Jordana dla $ \vp $. Baza Jordana jest złożona z $ (\vp-\la\id) $-serii generujących składniki rozkładów $ (\ast) $ dla $ \la\in\sp(\vp) $.

Macierz zbudowaną z klatek Jordana leżących na jej przekątnej nazywać będziemy macierzą Jordana. W języku macierzowym, nasze ustalenia można sformułować w postaci wniosku:

Stwierdzenie Każda macierz $ A\in\M{n}{n}{\c} $ jest podobna do macierzy w postaci Jordana. Dokładniej, istnieje macierz odwracalna $ C\in\M{n}{n}{\c} $ taka, że

$$C^{-1}AC=\mk{ccc}  {J_1&&\0\vspace{-2pt}\\  &\ddots&\vspace{-2pt}\\  \0&&J_s} \ ,$$

gdzie każda macierz $ J_l $ jest klatką Jordana $ J_k(\la) $ dla pewnego $ \la\in\sp(A) $, a liczba klatek $ J_k(\la) $ jest dana wzorem

$ \r[(A-\la I_n)^{k-1}]- 2\,\r[(A-\la I_n)^{k}]+ \r[(A-\la I_n)^{k+1}] $. W szczególności, macierz Jordana podobna do $ A $ jest wyznaczona jednoznacznie z dokładnością do kolejności klatek Jordana.

Dowód: Z Uwagi [link] zastosowanej do endomorfizmu $ \vp_A:\c^n\to\c^n $ danego wzorem $ T_A(Z)=\nolinebreak AZ $

wynika, że istnieje układ współrzędnych $ \si:\c^n\to\c^n $ taki, że $ \MP{\si}{\si}{\vp_A}= M(\si\circ\vp_A\circ\si^{-1})=M(\si)AM(\si^{-1}) $ jest macierzą Jordana. Jako $ C $ wystarczy więc przyjąć macierz $ M(\si^{-1}) $. □