Wielomian charakterystyczny, wektory własne

Wielomian charakterystyczny, wektory własne.

Pierwiastki wielomianu charakterystycznego macierzy, który definiujemy poniżej, pozwalają wyznaczać niezerowe wektory przechodzące pod działaniem tej macierzy na wektory proporcjonalne - wektory własne macierzy.

Definicja (#) Wielomianem charakterystycznym macierzy kwadratowej $ A\in\M{n}{n}{\K} $ nazywamy wielomian $ w_A(x)\in\K[x] $ określony wzorem

$$w_A(x)=\det(A-xI_n).$$

Definicja wielomianu charakterystycznego wymaga komentarza. Występujący w niej wzór najprościej można zinterpretować przy pomocy formuły z Twierdzenia [link] opisującej $ \det (A-xI_n) $ jako sumę iloczynów, których pewne czynniki mają postać $ a_{ii}-x $, gdzie $ a_{ii} $ są wyrazami z przekątnej $ A $.

Po wymnożeniu i pogrupowaniu wynika stąd wzór

$$w_A(x)=a_0+a_1(-x)\ldots+a_{n-1}(-x)^{n-1}+(-x)^n$$

pokazujący, że $ w_A(x) $ jest wielomianem. Łatwo zauważyć, że wyraz stały $ a_0 $ jest wyznacznikiem $ A $, zaś współczynnik przy $ (-x)^{n-1} $ jest sumą $ a_{n-1}=\sum_{i=1}^n a_{ii} $ wyrazów stojących na głównej przekątnej $ A $, którą nazywamy śladem macierzy $ A $ i oznaczamy $ \tr A $.

Jeśli $ \K $ jest ciałem nieskończonym (przypomnijmy, że w tym wykładzie najważniejsze są ciała $ \R $ i $ \c $), $ w_A(x) $ można utożsamiać z funkcją przypisującą skalarowi $ \la\in\K $ skalar $ \det (A-\la I_n) $ i w dalszym ciągu traktować będziemy $ w_A(x) $ właśnie w taki sposób - jako funkcję $ w_A:\K\to\K $.

Należy jednak zwrócić uwagę, że nad $ \Z_2 $, wielomian $ \det\left(\mk{cc}{1&0\\0&0}-x\mk{cc}{1&0\\0&1}\right)=-x+x^2\in\Z_2[x] $ określa funkcję tożsamościowo równą zero, a więc nie jest obojętne jak interpretujemy wzór w [link].

Definicja (#) Dla $ A\in\M{n}{n}{\K} $ pierwiastki wielomianu charakterystycznego $ w_A(x) $ nazywamy wartościami własnymi macierzy $ A $, a ich zbiór $ \sp (A)=\set{\la\in\K:w_A(\la)=0} $ - spektrum $ A $.

Wartości własne macierzy $ A\in\M{n}{n}{\K} $ są opisane równaniem $ \det (A-xI_n)=0 $, a więc, zob.\ [link],

$$\la\in\sp(A)\iff N(A-\la I_n)\neq\set{\0}.$$
Definicja (#) Niezerowe wektory z przestrzeni $ N(A-\la I_n) $, tzn.\ niezerowe wektory $ X\in\K^n $ takie, że $ AX=\la X $, nazywamy wektorami własnymi $ A $ $ ( $odpowiadającymi wartości własnej $ \la) $.

Określimy teraz ważną relację równoważności między macierzami kwadratowymi tego samego wymiaru - relację podobieństwa i sprawdzimy, że relacja podobieństwa zachowuje wielomian charakterystyczny.

Definicja (#) Macierze $ A,B\in\M{n}{n}{\K} $ są podobne, jeśli istnieje macierz odwracalna $ C\in\M{n}{n}{\K} $ taka, że $ B=C^{-1}AC $.
Twierdzenie (#) Macierze podobne mają identyczne wielomiany charakterystyczne.
Dowód: Niech $ B=C^{-1}AC $, gdzie $ A,B,C\in\M{n}{n}{\K} $. Należy pokazać, ze funkcje $ w_A $ i $ w_B $ na $ \K $ są identyczne. Istotnie, dla $ \la\in\K $ mamy $ w_B(\la)=\det (B-\la I_n)= \det (C^{-1}AC-\la I_n)= \det (C^{-1}(A-\la I_n)C)= \det C^{-1}\det (A-\la I_n)\det C= w_A(\la) $. □

Jak jednak wyjaśnimy w dalszym ciągu, macierze z identycznym wielomianem charakterystycznym nie muszą być podobne.

Twierdzenie [link], w połączeniu z następną obserwacją, pozwala zdefiniować wielomian charakterystyczny endomorfizmu.

Uwaga (#) Jeśli $ \vp:V\to V $ jest endomorfizmem przestrzeni liniowej $ V $, a $ \si,\ta:V\to \K^n $ są układami współrzędnych w $ V $, to macierze $ \MP{\ta}{\ta}{\vp} $ i $ \MP{\si}{\si}{\vp} $ są podobne.

Istotnie, dla macierzy $ C=M(\ta\circ\si^{-1}) $ zmieniającej współrzędne $ \si(\al) $ wektora $ \al $ na jego współrzędne $ \ta(\al) $, zob.\ Uwaga [link] (c), mamy $ \MP{\si}{\si}{\vp}=M(\si\circ\vp\circ\si^{-1})= M(\si\circ\ta^{-1}\circ\ta\circ\vp\circ\ta^{-1}\circ\ta\circ\si^{-1})= M(\si\circ\ta^{-1})M(\ta\circ\vp\circ\ta^{-1})M(\ta\circ\si^{-1})= C^{-1}\MP{\ta}{\ta}{\vp}C $.

Definicja (#) Wielomianem charakterystycznym endomorfizmu $ \vp:V\to V $ nazywamy wielomian $ w_T(x)=\det(\MP{\si}{\si}{\vp}-xI_n) $, gdzie $ \si:V\to\K^n $ jest dowolnym układem współrzędnych. Wyznacznikiem i śladem endomorfizmu $ \vp $ nazywamy wyraz wolny $ \det\vp=\det\MP{\si}{\si}{\vp} $ i współczynnik $ \tr\vp=\tr\MP{\si}{\si}{\vp} $ tego wielomianu, odpowiednio, a zbiór $ \sp (\vp) $ pierwiastków $ w_T(x) $ nazywamy spektrum endomorfizmu $ \vp $.

Ponieważ $ \ker(\vp-\la\id)=\si^{-1}(N(\MP{\si}{\si}{\vp}-\la I_n)) $, mamy

$$\la\in\sp(\vp)\iff \ker(\vp-\la\id)\neq\set{\0}.$$

Terminologię wprowadzoną w Definicji [link] przenosimy także na przypadek endomorfizmów.

Definicja (#) Dla endomorfizmu $ \vp:V\to V $ niezerowe wektory z $ \ker(\vp-\la\id) $, tzn.\ niezerowe wektory $ \al\in V $ takie, że $ \vp(\al)=\la \al $, nazywamy wektorami własnymi $ \vp $ $ ( $odpowiadającymi wartości własnej \nolinebreak $ \la) $.

Występujące w kolejnej uwadze operacje sumy algebraicznej i sumy prostej skończenie wielu podprzestrzeni przestrzeni liniowej $ V $ są naturalnymi uogólnieniami odpowiednich operacji dla dwóch składników wprowadzonych w Definicjach $ \ref{de:sua2} $ i $ \ref{de:sup2} $.

Uwaga (#) Dla endomorfizmu $ \vp:V\to V $:

  • [(a)] suma wektorów własnych odpowiadających parami różnym wartościom własnym $ \vp $ nie jest wektorem zerowym;
  • [(b)] wektory własne odpowiadające parami różnym wartościom własnym $ \vp $ są liniowo niezależne;
  • [(c)] suma algebraiczna $ \sum_{\la\in\sp(\vp)} \ker(\vp-\la\id) $ jest sumą prostą $ \bigoplus_{\la\in\sp(\vp)} \ker(\vp-\la\id) $.

Zdanie (c) orzeka, że dla dowolnego wyboru $ \al_\la\in\ker(\vp-\la\id) $, $ \la\in\sp(\vp) $, z równości $ \sum_{\la\in\sp(\vp)}\al_\la=\0 $ wynika, że wszystkie $ \al_\la $ są zerowe, a to jest konsekwencją (a). Zdanie (b) również wynika z (a), bo jeśli $ \al_\la $ jest wektorem własnym odpowiadającym wartości własnej $ \la $ i $ a_\la\neq 0 $, to $ a_\la\al_\la $ też jest wektorem własnym odpowiadającym $ \la $.

Własność (a) udowodnimy przez indukcję ze względu na liczbę składników $ k $. Załóżmy (a) dla sum mniej niż $ k $ wektorów własnych $ \vp $ i niech $ \al_j $ będzie wektorem własnym odpowiadającym $ \la_j $, $ j=1,\ldots,k $, gdzie $ \la_1,\ldots,\la_k $ są parami różne. Jeśli $ \sum_{j\leq k}\al_j=\0 $, to $ \0=\vp(\sum_{j\leq k}\al_j)-\la_k(\sum_{j\leq k}\al_j)=\sum_{j<k}(\la_j-\la_k)\al_j $, co \nolinebreak przeczy założeniu indukcyjnemu, bo $ \la_j-\la_k\neq 0 $ dla $ j<k $.

Endomorfizmy, których wektory własne rozpinają całą przestrzeń mają wyjątkowo prostą strukturę. Zgodnie z Uwagą [link] klasę takich endomorfizmów można opisać następująco:

Definicja Endomorfizm $ \vp:V\to V $ jest diagonalizowalny, jeśli $ V=\bigoplus_{\la\in\sp(\vp)} \ker(\vp-\la\id) $.

Macierz $ A\in\M{n}{n}{\K} $ jest diagonalizowalna, jeśli $ A $ jest podobna do macierzy diagonalnej.

Uwaga (#) Diagonalizowalność endomorfizmu $ \vp:V\to V $ oznacza istnienie bazy $ (\al_1,\ldots,\al_n) $ przestrzeni $ V $ złożonej z wektorów własnych $ \vp $ (por.\ Twierdzenie [link]). W układzie współrzędnych $ \si:V\to \K^n $ związanym z tą bazą, macierz $ D=\MP{\si}{\si}{\vp} $ jest diagonalna - jeśli $ \vp(\al_j)=\la_j\al_j $, to $ \la_1,\ldots,\la_n $ stoją na przekątnej $ D $, zob.\ Uwaga [link] (a). W szczególności, wielomian charakterystyczny $ w_\vp(x)=w_D(x)=(\la_{1}-x)\cdot\ldots\cdot(\la_{n}-x) $ ma rozkład na czynniki liniowe, a krotność każdego pierwiastka tego wielomianu jest równa $ \dim[\ker(\vp-\la\id)] $ (te dwa warunki charakteryzują diagonalizowalność $ \vp $, zob.\ Wniosek [link]).

Z Uwagi [link] wynika, że endomorfizm $ \vp $ jest diagonalizowalny wtedy i tylko wtedy, gdy dla dowolnego układu współrzędnych $ \ta:V\to\K^n $ macierz $ \MP{\ta}{\ta}{\vp} $ jest diagonalizowalna.

Najważniejszą klasę endomorfizmów diagonalizowalnych poznamy w części [link] - są to endomorfizmy samosprzężone na przestrzeniach euklidesowych.