Przekształcenia liniowe

Obok przestrzeni liniowych, podstawowym obiektem algebry liniowej są przekształcenia liniowe. Rozpatrując przekształcenia liniowe między przestrzeniami liniowymi będziemy zawsze zakładać, że są to przestrzenie liniowe nad tym samym ciałem skalarów $ \K $.

Przekształcenia liniowe

Przekształcenia liniowe to funkcje między przestrzeniami liniowymi zgodne z ich strukturą algebraiczną. Dokładniej, przyjmujemy następującą definicję.

Definicja (#) funkcję $ \vp:V\to W $ nazywamy przekształceniem liniowym jeśli $ f $ jest addytywna i jednorodna (zachowuje dodawanie wektorów i mnożenie wektora przez skalar), to znaczy spełnione są dwa warunki

$ (+) $ \ $ \vp(\al_1+\al_2)=\vp(\al_1)+\vp(\al_2) $ dla $ \al_1,\al_2\in V $; $ (\cdot) $\ $ \vp(c\al)=c\vp(\al) $ dla $ c\in\K $, $ \al\in V $.
Uwaga (#) Jeśli $ \vp:V\to W $ jest przekształceniem liniowym, to $ \vp(\0_V)=\vp(0\cdot\0_V)=0\vp(\0_V)=\0_W $.

Identyczność $ \id_V:V\to V $, funkcja stale równa zero $ \0:V\to W $ (funkcja zerowa) i mnożenie przez niezerowy skalar $ c\cdot\id_V:V\to  V $ (jednokładność o współczynniku $ c $) są przekształceniami liniowymi.

\mJak wyjaśnimy później, po ustaleniu baz w przestrzeniach liniowych, przekształcenia liniowe między tymi przestrzeniami można utożsamiać w naturalny sposób z macierzami. Na razie zauważmy, że macierze wyznaczają przekształcenia liniowe między przestrzeniami współrzędnych odpowiednich wymiarów.

Przykład (#) Macierz $ A\in\M{m}{n}{\K} $ wyznacza przekształcenie liniowe $ \vp_A:\K^n\to\K^m $ wzorem $ \vp_A(X)=AX $ (zob.\ Uwaga [link]).
Uwaga (#) Warunek zachowania dodawania wektorów i mnożenia wektora przez skalar można zastąpić warunkiem zachowywania kombinacji liniowych

$ \vp(x_1\al_1+\ldots+x_n\al_n)=x_1\vp(\al_1)+\ldots+x_n\vp(\al_n) $      dla      $ x_1,\ldots,x_n\in\K $, $ \al_1,\ldots,\al_n\in V $,

który łatwo wyprowadza się z $ (+) $ i $ (\cdot) $ przez indukcję ze względu na $ n\geq 1 $.

Dowolna funkcja określona na bazie przestrzeni liniowej $ V $ o wartościach w przestrzeni liniowej $ W $ przedłuża się jednoznacznie do przekształcenia liniowego z $ V $ w $ W $.

Twierdzenie (#) {\em\bf (o określaniu przekształceń liniowych na bazie).} Niech $ V,W $ będą przestrzeniami liniowymi nad $ \K $. Jeśli $ (\al_1,\ldots,\al_n) $ jest bazą $ V $, a $ (\be_1,\ldots,\be_n) $ układem wektorów z $ W $, to $ \vp:V\to W $ określone formułą

$ \vp(x_1\al_1+\ldots+x_n\al_n)=x_1\be_1+\ldots+x_n\be_n $

jest jedynym przekształceniem liniowym $ V $ w $ W $ takim, że $ \vp(\al_j)=\be_j $ dla $ j=1,\ldots,n $.

Dowód: Funkcja $ T $ jest dobrze określona, bo każdy wektor $ \al\in V $ jest kombinacją liniową wektorów bazy i współczynniki tej kombinacji są wyznaczone jednoznacznie. Z warunków (+), ($ \cdot $) w dowodzie Twierdzenia [link] zastosowanych do obu stron formuły definiującej $ \vp $ wynika, że tak określone $ \vp $ jest przekształceniem liniowym.

Jednoznaczność wynika z Uwagi [link]. □

W szczególności odnotujmy spostrzeżenie dotyczące przekształceń liniowych na sumach prostych (zob.\ Twierdzenie [link]).

Uwaga (#) Jeśli $ V=V_1\oplus V_2 $, $ T_i:V_i\to W $ jest liniowe dla $ i=1,2 $, to istnieje dokładnie jedno przekształcenie liniowe $ T:V\to W $ takie, że $ T(\al)=T_i(\al) $ dla $ \al\in V_i $, $ i=1,2 $. Istotnie, dla wektora $ \al $ mającego jednoznaczny rozkład na składowe $ \al=\al_1+\al_2 $ wystarczy zdefiniować $ T(\al)=T_1(\al_1)+T_2(\al_2) $.

Kończąc tę część, wskażemy dwa ważne typy przekształceń liniowych przestrzeni $ V $ w siebie.

Definicja Niech $ V=V_1\oplus V_2 $ i niech $ \al=\al_1+\al_1 $ będzie rozkładem $ \al\in V $ na składowe.

  • [$ (a) $](#) Przekształcenie liniowe $ \vp:V\to V $ takie, że $ \vp(\al_1+\al_2)=\al_1 $ $ (\vp $ jest identycznością na $ V_1 $ i zerowe na $ V_2) $ nazywamy rzutem $ V $ na $ V_1 $ równoległym do $ V_2 $.
  • [$ (b) $](#) Przekształcenie liniowe $ \ps:V\to V $ takie, że $ \ps(\al_1+\al_2)=\al_1-\al_2 $ $ (\ps $ jest identycznością na $ V_1 $ i mnożeniem przez $ -1 $ na $ V_2) $ nazywamy symetrią $ V $ względem $ V_1 $ równoległą do $ V_2 $ (zakładamy tu, że $ -1\neq 1 $ w $ \K $, czyli $ \K $ ma charakterystykę $ \neq 2 $).

Jądro i obraz, izomorfizmy

Przy opisie przekształcenia liniowego ważną rolę odgrywają dwie związane z nim podprzestrzenie liniowe: jądro i obraz.

Uwaga (#) Dla przekształcenia liniowego $ \vp:V\to W $ i podprzestrzeni $ V_0\subset V $ oraz $ W_0\subset W $.

  • [$ (a) $] Obraz $ \vp(V_0)=\set{\vp(\al):\al\in V_0} $ podprzestrzeni $ V_0\subset V $ jest podprzestrzenią $ W $.
  • [$ (b) $] Przeciwobraz $ \vp^{-1}(W_0)=\set{\al:\vp(\al)\in W_0} $ podprzestrzeni $ W_0\subset W $ jest podprzestrzenią $ V $.
Definicja Niech $ \vp:V\to W $ będzie przekształceniem liniowym.

  • [$ (a) $] (#) Obrazem $ \vp $ nazywamy podprzestrzeń $ \im\vp=\vp(V)=\set{\vp(\al):\al\in V} $ przestrzeni $ W $. Wymiar obrazu $ \dim\im\vp $ nazywamy rzędem $ \vp $ i oznaczamy przez $ \r\vp $.
  • [$ (b) $] (#) Jądrem $ \vp $ nazywamy podprzestrzeń $ \ker\vp=\vp^{-1}(\set{\0})=\set{\al\in V:\vp(\al)=\0} $ przestrzeni $ V $. Wymiar jądra $ \dim\ker\vp $ nazywamy defektem $ \vp $ i oznaczamy przez $ \d\vp $.

Obraz i jądro przekształcenia liniowego wyznaczonego przez macierz mają ścisły związek z pojęciami wprowadzonymi w części [link].

Uwaga (#) Dla przekształcenia $ \vp_A:\K^n\to\K^m $ wyznaczonego przez macierz $ A\in\M{m}{n}{\K} $ (zob.\ Przykład [link]) $ \im\vp_A=K(A) $, $ \r\vp_A=\r A $, $ \ker\vp_A=N(A) $ i, z Twierdzenia [link], $ \d\vp_A=n-\r A $.

Następujące proste twierdzenie opisuje ważną własność przekształceń liniowych: trywialność jądra implikuje różnowartościowość.

Twierdzenie (#) Przekształcenie liniowe $ T $ jest różnowartościowe wtedy i tylko wtedy, gdy $ \ker\vp=\set{\0} $.
Dowód: Niech $ \vp:V\to W $. Dla $ \ga,\al\in V $ równość $ \vp(\ga)=\vp(\al) $ oznacza, że $ \vp(\ga)-\vp(\al)=\0 $, ale $ \vp(\ga)-\vp(\al)=\vp(\ga-\al)=\0 $ wtedy i tylko wtedy, gdy $ \ker\vp=\set{\0} $. □

Wyróżnimy teraz trzy ważne klasy przekształceń liniowych.

Definicja Przekształcenie liniowe $ \vp:V\to W $ nazywamy

  • [$ (a) $] (#) epimorfizmem jeśli $ \im\vp=W $,
  • [$ (b) $] (#) monomorfizmem jeśli $ \ker\vp=\set{\0} $,
  • [$ (c) $] (#) izomorfizmem liniowym jeśli $ \vp $ jest epimorfizmem i monomorfizmem.
Twierdzenie (#) Funkcja odwrotna $ T^{-1} $ do izomorfizmu liniowego $ \vp:V\to W $ jest przekształceniem liniowym $ T^{-1}:W\to V $.
Dowód: Istnienie funkcji odwrotnej $ \vp^{-1} $ wynika z Twierdzenia [link]. Dla sprawdzenia, że $ \vp^{-1} $ zachowuje dodawanie wektorów weźmy $ \be_i=\vp(\al_i)\in W $ dla $ i=1,2 $. Wtedy $ \vp(\al_1+\al_2)=\be_1+\be_2 $ i przykładając do obu stron tej równości $ \vp^{-1} $ otrzymujemy $ \al_1+\al_2=\vp^{-1}(\be_1+\be_2) $, czyli $ \vp^{-1}(\be_1)+\vp^{-1}(\be_2)=\vp^{-1}(\be_1+\be_2) $. Analogicznie sprawdza się, że $ \vp^{-1} $ zachowuje mnożenie wektora przez skalar. □

Z twierdzenia o określaniu przekształceń liniowych na bazie wynika, że własności przekształcenia liniowego $ \vp:V\to W $ są wyznaczone przez układ $ (\vp(\al_1),\ldots,\vp(\al_n)) $ obrazów wektorów ustalonej bazy $ (\al_1,\ldots,\al_n) $ przestrzeni $ V $.

Twierdzenie (#) Niech $ \vp:V\to W $ będzie przekształceniem liniowym określonym na przestrzeni $ V $ z bazą $ (\al_1,\ldots,\al_n) $. Wtedy

  • [$ (a) $] (#) $ \vp $ jest epimorfizmem wtedy i tylko wtedy, gdy układ $ (\vp(\al_1),\ldots,\vp(\al_n)) $ rozpina $ W $.
  • [$ (b) $] (#) $ \vp $ jest monomorfizmem wtedy i tylko wtedy, gdy układ $ (\vp(\al_1),\ldots,\vp(\al_n)) $ jest liniowo niezależny.
  • [$ (c) $] (#) $ \vp $ jest izomorfizmem wtedy i tylko wtedy, gdy układ $ (\vp(\al_1),\ldots,\vp(\al_n)) $ jest bazą $ W $.
Dowód: Część (a) wynika z równości $ \im\vp=\vp(\lin(\al_1,\ldots,\al_n))= \lin(\vp(\al_1),\ldots,\vp(\al_n)) $, część (b) z równoważności $ \sum_{j=1}^n x_j\vp(\al_j)=\0\iff\sum_{j=1}^n x_j\al_j\in\ker\vp $, a część (c) jest konsekwencją (a) i (b). □

Mówimy, że przestrzenie liniowe $ V,W $ nad $ \K $izomorficzne jeśli istnieje izomorfizm liniowy $ V $ na $ W $. Z części (c) i z twierdzenia o określaniu przekształceń liniowych na bazie wynika

Stwierdzenie (#) Przestrzenie liniowe $ V $ i $ W $ są izomorficzne wtedy i tylko wtedy, gdy $ \dim V=\dim W $.

Szczególnie ważną rolę pełnią izomorfizmy przestrzeni $ V $ na przestrzeń współrzędnych wymiaru $ \dim V $ - układy współrzędnych. Właściwy dobór układu współrzędnych znacznie upraszcza analizę wielu zagadnień algebry liniowej.

Ostatnie twierdzenie tej części można, przechodząc do przestrzeni współrzędnych, wyprowadzić z Twierdzenia [link] (por.\ Uwaga [link]). Podamy jednak bezpośredni dowód, a systematyczne wykorzystanie układów współrzędnych poprzedzimy analizą przekształceń liniowych na przestrzeniach współrzędnych.

Twierdzenie (#) Jeżeli $ T:V\to W $ jest przekształceniem liniowym, to $ \dim V=\d\vp+\r\vp $.
Dowód: Niech $ U $ będzie podprzestrzenią $ V $ taką, że $ V=\ker\vp\oplus U $ (zob.\ Wniosek [link]) i niech $ \ps=\vp|U:U\to W $ będzie obcięciem $ \vp $ do $ U $ ($ \ps(\ga)=\vp(\ga) $ dla $ \ga\in U $). Wtedy $ \im S=\im \vp $, bo dla $ \al=\be+\ga\in \ker\vp\oplus U $ mamy $ \vp(\al)=\vp(\be)+\vp(\ga)=\ps(\ga) $. Z Twierdzenia [link] $ \ker\vp \cap U=\set{\0} $, więc $ \ps $ jest izomorfizmem $ U $ na $ \im \vp $ i z Wniosku [link] mamy $ \dim V= \d \vp+\dim U= \d \vp+\r \vp $. □

Przekształcenia liniowe przestrzeni współrzędnych

Przekształcenie liniowe $ \vp:\K^n\to \K^m $ jest jednoznacznie wyznaczone przez układ $ (\vp(\ep_1),\ldots,\vp(\ep_n)) $ wartości $ \vp $ na wektorach bazy standardowej przestrzeni $ \K^n $ (zob. Twierdzenie [link]).

Definicja (#) Macierzą przekształcenia liniowego $ \vp:\K^n\to\K^m $ nazywamy macierz $ M(\vp)\in\M{m}{n}{\K} $ postaci $ M(\vp)=[\vp(\ep_1),\ldots,\vp(\ep_n)] $, gdzie $ (\ep_1,\ldots,\ep_n) $ jest bazą standardową $ \K^n $.

Następne twierdzenie ustala podstawowe związki między przekształceniem liniowym przestrzeni współrzędnych i jego macierzą.

Twierdzenie (#) Jeśli $ \vp:\K^n\to\K^m $ jest przekształceniem liniowym, to $ \vp(X)=M(\vp)X $ dla $ X\in\K^n $. Co więcej

  • [$ (a) $] (#) $ \vp $ jest epimorfizmem wtedy i tylko wtedy, gdy $ \r M(\vp)=m $.
  • [$ (b) $] (#) $ \vp $ jest monomorfizmem wtedy i tylko wtedy, gdy $ \r M(\vp)=n $.
  • [$ (c) $] (#) $ \vp $ jest izomorfizmem wtedy i tylko wtedy, gdy $ \r M(\vp)=m=n $.
Dowód: Jeśli $ X=\sum_{j=1}^n x_j\ep_j\in\K^n $, to $ \vp(X)=\vp(\sum_{j=1}^n x_j\ep_j)=\sum_{j=1}^n x_j\vp(\ep_j)=[\vp(\ep_1),\ldots,\vp(\ep_n)]X $. Druga część tezy wynika z Twierdzenia [link]

Z pierwszej części tezy wynika, że przyporządkowanie przekształceniu $ \vp:\K^n\to\K^m $ jego macierzy $ M(\vp)=[\vp(\ep_1),\ldots,\vp(\ep_n)]\in\M{m}{n}{\K} $ jest operacją odwrotną do opisanego w Przykładzie [link] przyporządkowania macierzy $ A\in\M{m}{n}{\K} $ przekształcenia $ \vp_A:\K^n\to\K^m $.

Zdefiniujemy teraz operację mnożenia macierzy odpowiadającą składaniu przekształceń. Jeśli macierz $ B=[B_1,\ldots,B_k]\in\M{n}{k}{\K} $ wyznacza $ \vp_B:\K^k\to\K^n $ (czyli $ \vp_B(E_l)=B_l $ dla $ l=1,\ldots,k $), a macierz $ A\in\M{m}{n}{\K} $ wyznacza $ \vp_A:\K^n\to\K^m $, to złożenie $ \vp_A\circ\vp_B:\K^k\to\K^m $ jest przekształceniem liniowym i

$ M(\vp_A\circ\vp_B) =[\vp_A\circ\vp_B(\ep_1),\ldots,\vp_A\circ\vp_B(\ep_k)]= [\vp_A(B_1),\ldots,\vp_A(B_k)]=[AB_1,\ldots,AB_k] $.
Definicja (#) Wynikiem pomnożenia macierzy $ A\in\M{m}{n}{\K} $ przez macierz $ B=[B_1,\ldots,B_k]\in\M{n}{k}{\K} $ nazywamy macierz $ AB=[AB_1,\ldots,AB_k]\in\M{m}{k}{\K} $.
Definicja Macierzą jednostkową nazywamy macierz $ I_n=M(\id_{_{\K^n}})= [\ep_1,\ldots,\ep_n] $.
Uwaga

  • [(a)] Podobnie, jak złożenie funkcji $ f\circ g $ jest określone tylko wtedy, gdy dziedzina $ f $ jest przeciwdziedziną $ g $, iloczyn macierzy $ AB $ ma sens tylko wtedy, gdy liczba kolumn $ A $ jest taka jak liczba wierszy $ B $. Mówiąc o iloczynie macierzy zawsze zakładamy zgodność odpowiednich wymiarów.

  • [(b)] Jeśli $ A\in\M{m}{n}{\K} $, to $ AI_n=A=I_m A $ (bo $ \vp_A\circ\id_{_{\K^n}}=\vp_A=\id_{_{\K^m}}\circ\vp_A $).
  • [(c )] Mnożenie macierzy jest łączne, czyli $ A(BC)=(AB)C $, co wynika z łączności składania funkcji.
  • [(d)] Mnożenie macierzy nie zawsze jest przemienne (nawet wtedy, gdy zmiana kolejności czynników ma sens).

    $ \mk{rr}{0&-1\\1&0}\mk{rr}{1&0\\0&-1}=\mk{rr}{0&1\\1&0} $, \ $ \mk{rr}{1&0\\0&-1}\mk{rr}{0&-1\\1&0}=\mk{rr}{0&-1\\-1&0} $.

  • [(e)] Iloczyn macierzy niezerowych może być macierzą zerową $ \mk{rr}{0&1\\0&0}\mk{rr}{0&1\\0&0}=\mk{rr}{0&0\\0&0} $.

Przestrzenie przekształceń liniowych

Niech $ V $ i $ W $ będą przestrzeniami liniowymi nad $ \K $. Zbiór $ \ho{V}{W} $ przekształceń liniowych z $ V $ do $ W $ będziemy rozpatrywać jako przestrzeń liniową nad $ \K $ z przekształceniem zerowym $ \0 $ jako wektorem zerowym oraz naturalnymi działaniami dodawania i mnożenia przez skalary określonymi następująco: dla $ \vp_1,\vp_2,\vp\in \ho{V}{W} $, $ c\in\K $ i $ \al\in V $

(+)      $ (\vp_1+\vp_2)(\al)=\vp_1(\al)+\vp_2(\al) $; ($ \cdot $)     $ (c\vp)(\al)=c(\vp(\al)) $.

Następujące twierdzenie pozwala utożsamić, z zachowaniem operacji algebraicznych, przestrzenie przekształceń $ \ho{\K^n}{\K^m} $ z przestrzeniami macierzy $ \M{m}{n}{\K} $ opisanymi w Przykładzie [link] (b).

Twierdzenie (#) Przyporządkowanie przekształceniu liniowemu $ \vp:\K^n\to\K^m $ jego macierzy $ M(\vp) $ jest izomorfizmem liniowym przestrzeni $ \ho{\K^n}{\K^m} $ na przestrzeń macierzy $ \M{m}{n}{\K} $.
Dowód: Widzieliśmy, że przyporządkowanie macierzy $ A\in\M{m}{n}{\K} $ przekształcenia $ \vp_A\in\ho{\K^n}{\K^m} $ jest odwróceniem funkcji $ \vp\to M(\vp) $. Sprawdzimy, że ta funkcja zachowuje dodawanie i mnożenie przez skalar, czyli dla $ \vp_1,\vp_2,\vp\in \ho{V}{W} $, $ c\in\K $ spełnione są warunki

(+)      $ M(\vp_1+\vp_2)=M(\vp_1)+M(\vp_2) $; ($ \cdot $)     $ M(c\vp)=cM(\vp) $.

Istotnie, $ M(\vp_1+\vp_2)= [(\vp_1+\vp_2)(\ep_1)\,,\,\ldots\,,\,(\vp_1+\vp_2)(\ep_n)]= [\vp_1(\ep_1)+\vp_2(\ep_1)\,,\,\ldots\,,\,\vp_1(\ep_n)+\vp_2(\ep_n)]= $

$ =[\vp_1(\ep_1),\ldots,\vp_1(\ep_n)]+[\vp_2(\ep_1),\ldots,\vp_2(\ep_n)]= M(\vp_1)+M(\vp_2) $

oraz $ M(c\vp)=[(c\vp)(\ep_1),\ldots,(c\vp)(\ep_n)]=[c\vp(\ep_1),\ldots,c\vp(\ep_n)]= c[\vp(\ep_1),\ldots,\vp(\ep_n)]=cM(\vp) $. □

Uwaga Przyporządkowanie przekształceniu liniowemu przestrzeni współrzędnych jego macierzy przeprowadza operację złożenia przekształceń na mnożenie macierzy, więc z łatwych do sprawdzenia własności przekształceń natychmiast wynikają następujące algebraiczne własności mnożenia macierzy (zakładamy zgodność wymiarów macierzy w odpowiednich działaniach)

  • [(a)] $ (A_1+A_2)B=A_1B+A_2B $,
  • [(b)] $ A(B_1+B_2)=AB_1+AB_2 $,
  • [(c)] $ A(cB)=c(AB)=(cA)B $.

Izomorfizmy przestrzeni współrzędnych

Macierz mającą $ m $ wierszy i $ m $ kolumn nazywamy macierzą kwadratową. Macierze kwadratowe z $ \M{m}{m}{\K} $ odpowiadają przekształceniom $ T:\K^m\to\K^m $, przy czym macierze odpowiadające izomorfizmom są elementami odwracalnymi w $ \M{m}{m}{\K} $, ze względu na operację mnożenia.

Definicja Macierz kwadratową $ A\in\M{m}{m}{\K} $ nazywamy macierzą odwracalną jeśli istnieje macierz kwadratowa $ M\in\M{m}{m}{\K} $ taka, że $ MA=I_{m} $
Uwaga Dla macierzy kwadratowych $ A,M\in\M{m}{m}{\K} $ warunek $ MA=I_{m} $ oznacza, że $ T_M:\K^m\to\K^m $ jest epimorfizmem, a $ T_A:\K^m\to\K^m $ jest monomorfizmem. Z Twierdzenia [link] wynika, że $ \r M=\r A=m $, czyli $ T_A $ i $ T_M $ są wzajemnie odwrotnymi izomorfizmami $ \K^m $ oraz $ AM=MA=I_{m} $.
Definicja Jeśli macierz kwadratowa $ A\in\M{m}{m}{\K} $ jest odwracalna, to macierz $ M(T_A^{-1}) $ izomorfizmu odwrotnego do $ T_A $ nazywamy macierzą odwrotną do $ A $ i oznaczamy przez $ A^{-1} $.

Podamy teraz metodę znajdowania macierzy odwrotnej korzystającą z interpretacji operacji elementarnych na wierszach macierzy jako pewnych izomorfizmów przestrzeni współrzędnych.

\mNiech $ \E $ będzie operacją elementarną na wierszach macierzy z $ \M{m}{n}{\K} $. Wynik operacji $ \E $ na macierzy $ A $ będziemy oznaczać przez $ \E(A) $, niezależnie od liczby kolumn macierzy $ A $ (także dla macierzy jednokolumnowych). W szczególności, dla macierzy $ A=[A_1,\ldots,A_n] $ mamy $ \E(A)=[\E(A_1),\ldots,\E(A_n)] $.

\mOperacja $ \E $ na macierzach jednokolumnowych jest odwracalną funkcją $ \E:\K^m\to\K^m $ zachowującą kombinacje liniowe (jeśli $ x_1A_1+\ldots+x_nA_n=B $, to $ x_1\E(A_1)+\ldots+x_n\E(A_n)=\E(B) $, zob.\ Twierdzenie [link])

Definicja (#) Izomorfizm $ \E:\K^m\to\K^m $ wyznaczony przez operację elementarną na wierszach $ \E $ nazywamy izomorfizmem elementarnym, a jego macierz $ M(\E)=[\E(\ep_1),\ldots,\E(\ep_m)]=\E(I_m) $ nazywamy macierzą elementarną.
Uwaga (#) Wykonanie operacji elementarnej $ \E $ na wierszach macierzy $ A=[A_1,\ldots,A_n]\in\M{m}{n}{\K} $ daje macierz $ \E(A)=[\E(A_1),\ldots,\E(A_n)]=[\E(T_A(E_1)),\ldots,\E(T_A(E_n))]=M(\E\circ T_A)=M(\E)A $, czyli odpowiada pomnożeniu macierzy $ A $ z lewej strony przez macierz elementarną $ M(\E) $ izomorfizmu $ \E $.
Twierdzenie (#) Macierz odwracalną $ A\in\M{m}{m}{\K} $ można zredukować do macierzy jednostkowej $ I_m $ operacjami elementarnymi na wierszach. Jeśli $ \E_p,\ldots,\E_1 $ są operacjami redukującymi $ A $ do $ I_m $, to iloczyn macierzy elementarnych $ M(\E_p)\cdot\ldots\cdot M(\E_1) $ jest macierzą odwrotną do $ A $.
Dowód: Macierz $ A $ ma rząd $ m $, więc redukując $ A $ do postaci schodkowej otrzymamy macierz $ A' $ mającą na przekątnej wyrazy niezerowe i zera pod przekątną. Wykonując operacje typu (I) z użyciem ostatniego wiersza macierzy $ A' $ można wyzerować wszystkie, prócz ostatniego wyrazy ostatniej kolumny tej macierzy, wykorzystując przedostatni wiersz w podobny sposób można wyzerować wszystkie wyrazy przedostatniej kolumny leżące w poprzednich wierszach i po kolejnych, analogicznych krokach otrzymać macierz diagonalną $ B $ (czyli macierz mającą zera poza przekątną). Operacjami typu (III) można następnie zamienić wszystkie wyrazy przekątnej $ B $ na jedynki.

Jeśli $ \E_p,\ldots,\E_1 $ są operacjami redukującymi macierz $ A $ do $ I_m $, to złożenie $ \vp=\E_p\circ\ldots\circ\E_1 $ izomorfizmów elementarnych przeprowadza $ j $-tą kolumnę macierzy $ A $ na $ j $-tą kolumnę macierzy $ I_m $, jest więc izomorfizmem odwrotnym do izomorfizmu $ T_A $, a jego macierz $ M(T)=M(\E_p)\cdot\ldots\cdot M(\E_1) $ jest macierzą odwrotną do $ A $. □

Jeśli macierz $ A\in\M{m}{m}{\K} $ jest odwracalna, to macierz $ A^{-1} $ też jest odwracalna i $ (A^{-1})^{-1}=A $, więc z drugiej części tezy dla macierzy odwracalnej $ A^{-1} $ dostajemy

Stwierdzenie (#) Macierz odwracalna $ A\in\M{m}{m}{\K} $ jest iloczynem skończenie wielu macierzy elementarnych.
Uwaga (#) Niech $ [A|I_m]\in\M{m}{m+m}{\K} $ będzie macierzą powstałą przez dopisanie do macierzy odwracalnej $ A\in\M{m}{m}{\K} $ macierzy jednostkowej $ I_m $. Redukując macierz $ [A|I_m] $ do macierzy $ [I_m|M] $ operacjami elementarnymi $ \E_p,\ldots,\E_1 $ otrzymujemy w dopisanej części macierz złożenia $ \E_p\circ\ldots\circ\E_1 $ redukujących izomorfizmów elementarnych, czyli $ M=M(\E_p\circ\ldots\circ\E_1)=A^{-1} $.

Przy odwracaniu iloczynu macierzy musimy zmienić kolejność czynników.

Twierdzenie Jeśli macierze $ A,B\in\M{m}{m}{\K} $ są odwracalne i $ c\in\K $ jest niezerowym skalarem, to iloczyny $ AB $ i $ cA $ są macierzami odwracalnymi i $ (AB)^{-1}=B^{-1}A^{-1} $ oraz $ (cA)^{-1}=c^{-1}A^{-1} $.
Dowód: Mnożenie macierzy jest łączne, więc $ (B^{-1}A^{-1})AB=B^{-1}(A^{-1}A)B=B^{-1}B=I_m $. Analogicznie, $ c^{-1}A^{-1}(cA)=c^{-1}cA^{-1}A=I_m $. □

Macierz przekształcenia

Opiszemy teraz przejście od dowolnych przestrzeni liniowych do przestrzeń współrzędnych odwołując się do istnienia izomorfizmu przestrzeni liniowej na przestrzeń współrzędnych odpowiedniego wymiaru.

Dla wyróżnienia takich izomorfizmów, będziemy je oznaczali greckimi literami $ \si,\ta $.

Definicja (#) Izomorfizmy $ n $-wymiarowej przestrzeni $ V $ nad $ \K $ na przestrzeń $ \K^n $ nazywamy układami współrzędnych w $ V $. Układem współrzędnych związanym z bazą $ (\al_1,\ldots,\al_n) $ w $ V $ nazywamy izomorfizm $ \si: V\to \K^n $ przeprowadzający $ \al_j $ na $ \ep_j $, $ j=1,\ldots,n $.
Uwaga

  • [(a)] Układ współrzędnych $ \si $ związany z bazą $ (\al_1,\ldots,\al_n) $ przestrzeni $ V $ przeprowadza wektor $ \al=\sum_{j=1}^n x_j\al_j\in V $ na wektor $ X=\sum_{j=1}^n x_j\ep_j\in\K^n $ współrzędnych $ \al $ w tej bazie.
  • [(b)] Dowolny układ współrzędnych $ \si:V\to \K^n $ jest związany z bazą $ (\si^{-1}(\ep_1),\ldots,\si^{-1}(\ep_n)) $,
  • [(c)] Jeśli $ \si,\si':V\to \K^n $ są układami współrzędnych w $ V $, to złożenie $ \si'\circ\si^{-1}:\K^n\to\K^n $ zmienia współrzędne $ \si(\al) $ wektora $ \al $ w $ \si $ na współrzędne $ \al $ w $ \si' $ (bo $ \si'\circ\si^{-1}(\si(\al))=\si'(\al) $).

Pokażemy teraz jak wybór układów współrzędnych w $ V $ i $ W $ pozwala przyporządkować każdemu przekształceniu liniowemu $ \vp:V\to W $ jego macierz w tych układach współrzędnych.

Definicja Niech $ \si:V\to\K^n $ będzie układem współrzędnych w $ V $, a $ \ta:W\to\K^m $ układem współrzędnych w $ W $. Macierzą przekształcenia liniowego $ \vp:V\to W $ w układach $ \si $, $ \ta $ nazywamy macierz $ \MP{\si}{\ta}{\vp}=M(\ta\circ\vp\circ\si^{-1}) $, gdzie $ \ta\circ\vp\circ\si^{-1}:\K^n\to\K^m $.
Uwaga (#) Niech $ \vp: V\to W $ będzie przekształceniem liniowym określonym na przestrzeni $ V $ z bazą $ (\al_1,\ldots,\al_n) $ związaną z układem współrzędnych $ \si:V\to \K^n $ i niech $ \ta:W\to \K^m $ będzie układem współrzędnych w $ W $. Wtedy

  • [(a)] $ \MP{\si}{\ta}{\vp}=[\ta(\vp(\al_1)),\ldots,\ta(\vp(\al_n))] $ (bo $ \ta\circ\vp\circ\si^{-1}(\ep_j)=\ta(\vp(\al_j)) $ dla $ j=1,\ldots,n) $,

  • [(b)] $ \MP{\si}{\ta}{\vp}\cdot\si(\al)=\ta(\vp(\al)) $ dla $ \al\in V $ (bo $ \ta\circ\vp\circ\si^{-1}(\si(\al))=\ta(\vp(\al)) $).

Dla ustalonych układów współrzędnych $ \si: V\to \K^n $ i $ \ta:W\to \K^m $ przyporządkowanie przekształceniu liniowemu $ \vp\in\ho{V}{W} $ złożenia $ \ta\circ T\circ\si^{-1}:\K^n\to\K^m $ jest izomorfizmem liniowym $ \ho{V}{W} $ na $ \ho{\K^n}{\K^m} $. Z Twierdzenia [link] wynika więc

Twierdzenie Dla ustalonych układów współrzędnych $ \si: V\to \K^n $ i $ \ta:W\to \K^m $ przyporządkowanie przekształceniu liniowemu $ \vp\in\ho{V}{W} $ jego macierzy $ \MP{\si}{\ta}{\vp} $ jest izomorfizmem liniowym przestrzeni przekształceń $ \ho{V}{W} $ na przestrzeń macierzy $ \M{m}{n}{\K} $.

Przestrzeń funkcjonałów

Niech $ V $ będzie $ n $-wymiarową przestrzenią liniową nad ciałem $ \K $. Przestrzeń $ \ho{V}{\K} $ nazywamy przestrzenią sprzężoną do przestrzeni $ V $, a jej elementy - przekształcenia liniowe $ f: V\to \K $, nazywamy funkcjonałami liniowymi.

Uwaga (#) Niech $ \A=(\al_1,\ldots,\al_n) $ będzie bazą przestrzeni $ V $ i niech $ f_i:V\to \K $ będzie jedynym funkcjonałem liniowym takim, że

$ (\ast) $ $ f_i(\al_j)=\left\{\md{lll}{1&\mbox{jeśli}&i=j\ ,\\ 0&\mbox{jeśli}&i\neq j\ .} \right. $

Wtedy

  • [(a)] $ \al=\sum_j f_j(\al)\al_j $ dla $ \al\in V $, czyli $ f_i $ przyporządkowuje wektorowi jego $ i $-tą współrzędną w bazie $ \A $.\\ Istotnie, dla $ \al=\sum_j x_j\al_j $, $ f_i(\al)=f_i(\sum_j x_j\al_j)= \sum_j x_jf_i(\al_j)=x_i $.

  • [(b)] $ f=\sum_i f(\al_i)f_i $ dla $ f\in V^\ast $, przy czym przedstawienie jest jednoznaczne.\\ Istotnie, obie strony równości przyjmują na wektorze $ \al_j $ bazy $ \A $ wartość $ f(\al_j) $, więc są równe. Analogiczny argument pokazuje jednoznaczność przedstawienia $ f $ jako sumy $ f=\sum_i a_if_i $.
  • [(c)] Układ funkcjonałów $ \A^\ast=(f_1,\ldots,f_n) $ jest bazą $ V^\ast $ i wartość funkcjonału $ f\in V^\ast $ na wektorze $ \al_j $ jest $ j $-tą współrzędną tego funkcjonału w bazie $ \A^\ast $.
Definicja Bazy $ (\al_1,\ldots,\al_n) $ w $ V $ i $ (f_1,\ldots,f_n) $ w $ V^\ast $ nazywamy dualnymi, jeśli spełniony jest warunek $ (\ast) $ w Uwadze [link].
Twierdzenie Dla każdej bazy $ (f_1,\ldots,f_n) $ w przestrzeni $ V^\ast $ istnieje dualna do niej baza $ (\al_1,\ldots,\al_n) $ w przestrzeni $ V $.
Dowód: Niech $ V^{\ast\ast}=(V^\ast)^\ast $ i niech $ J:V\to V^{\ast\ast} $ będzie przekształceniem liniowym określonym wzorem

$$J(\al)(f)=f(\al) \ ,\ \mbox{ dla } \al\in V \mbox{ i } f\in V^\ast.$$

Jeśli $ \al\neq\0 $, to istnieje $ f\in V^\ast $ takie, że $ f(\al)\neq\0 $, a więc $ J(\al)\neq\0 $ (w $ V^{\ast\ast} $). Zatem $ J $ jest monomorfizmem i ponieważ (zob.\ Uwaga [link]) $ \dim V=\dim V^\ast=\dim V^{\ast\ast} $, $ J $ jest izomorfizmem.

Zgodnie z [link], dla bazy $ (f_1,\ldots,f_n) $ przestrzeni $ V^\ast $ istnieje baza $ (\ga_1,\ldots,\ga_n) $ w $ V^{\ast\ast} $ spełniająca warunek

$ (\ast\ast) $ $ \ga_i(f_j)=\left\{\md{lll}{1&\mbox{jeśli}&i=j\ ,\\ 0&\mbox{jeśli}&i\neq j\ .} \right. $

Jeśli $ (\al_1,\ldots,\al_n) $ jest bazą $ V $ taką, że $ J(\al_i)=\ga_i $, to $ \ga_i(f_j)=J(\al_i)(f_j)=f_j(\al_i) $, więc z ($ \ast\ast $) wynika, że bazy $ (\al_1,\ldots,\al_n) $ oraz $ (f_1,\ldots,f_n) $ są dualne. □

Definicja (#) Niech $ \vp: V\to W $ będzie przekształceniem liniowym. Przekształceniem sprzężonym do $ \vp $ nazywamy przekształcenie liniowe $ \vp^\ast:W^\ast\to V^\ast $ określone formułą

$$\vp^\ast (g)=g\circ \vp \ ,\ \mbox{ dla } g\in W^\ast.$$

Pokażemy, że przy wyborze baz dualnych $ V,V^\ast $ oraz $ W,W^\ast $, macierze przekształceń $ \vp $ i $ \vp^\ast $ w związanych z tymi bazami układach współrzędnych powstają, jedna z drugiej, przez zamianę kolumn na wiersze, tzn.\ przez transponowanie.

Zacznijmy od wprowadzenia operacji transpozycji macierzy.

Definicja Macierzą transponowaną macierzy $ A\in\M{m}{n}{\K} $ nazywamy macierz $ A^T\in\M{n}{m}{\K} $, której kolejne kolumny są kolejnymi wierszami macierzy $ A $.
Uwaga (#) Dla macierzy $ A\in\M{m}{n}{\K} $

  • [(a)] $ (A^T)^T=A $ (bo zamiana kolumn na wiersze zmienia wiersze na kolumny),
  • [(b)] $ \r A^T=\r A $ (zob.\ Twierdzenie [link]).
  • [(c)] $ (AB)^T=B^TA^T $ (jeśli iloczyn $ AB $ ma sens, to iloczyn $ B^TA^T $ również ma sens, a równość można sprawdzić porównując odpowiednie wyrazy tych iloczynów).
  • [(d)] $ (A^T)^{-1}=(A^{-1})^T $ jeśli $ A $ jest macierzą odwracalną (bo $ (A^{-1})^T A^T=(AA^{-1})^T=I^T=I $).
Twierdzenie Niech $ \vp: V\to W $ będzie przekształceniem liniowym i niech $ \si: V\to \K^n $, $ \ta: W\to \K^m $ będą układami współrzędnych związanymi z pewnymi bazami $ V $ i $ W $, a $ \hat{\si}: V^\ast\to \K^n $, $ \hat{\ta}: W^\ast\to \K^m $ będą układami współrzędnych związanymi z bazami dualnymi do nich. Wówczas

$$\MP{\hat{\ta}}{\hat{\si}}{\vp^\ast}=\MP{\si}{\ta}{\vp}^T.$$
Dowód: Niech $ \si $ i $ \ta $ będą związane z bazami $ (\al_1,\ldots,\al_n) $ w $ V $, $ (\be_1,\ldots,\be_m) $ w $ W $, a układy $ \hat{\si} $ i $ \hat{\ta} $, z bazami dualnymi $ (f_1,\ldots,f_n) $ w $ V^\ast $ i $ (g_1,\ldots,g_m) $ w $ W^\ast $, odpowiednio.

Na mocy Uwagi [link] (a), $ i $-ty wyraz $ j $-tej kolumny macierzy $ \MP{\si}{\ta}{\vp} $ jest $ i $-tą współrzędną współrzędną wektora $ \ta(\vp(\al_j)) $, która zgodnie z Uwagą [link] (a) ma postać $ a_{ij}=g_i(\vp(\al_j)) $.

Po transpozycji, $ a_{ij} $ staje się $ i $-tym wyrazem $ j $-tego wiersza macierzy transponowanej, a odpowiedni wyraz $ b_{ji} $ macierzy $ \MP{\hat{\ta}}{\hat{\si}}{\vp^\ast} $ jest $ j $-tą współrzędną $ i $-tej kolumny tej macierzy, która zgodnie z Uwagą [link] (c) ma postać $ b_{ji}=\vp^\ast(g_i)(\al_j) $. Z definicji $ \vp^\ast $ mamy $ b_{ji}=g_i\circ\vp(\al_j)=a_{ij} $, co kończy dowód. □

Z twierdzenia wyprowadzimy następujący wniosek

Stwierdzenie Niech $ \vp:V\to W $ będzie przekształceniem liniowym. Wówczas

  • [$ (a) $] $ \vp $ jest monomorfizmem $ \iff $ $ \vp^\ast $ jest epimorfizmem.
  • [$ (b) $] $ \vp $ jest epimorfizmem $ \iff $ $ \vp^\ast $ jest monomorfizmem.
Dowód: Z Uwagi [link] (b) $ \r\vp=\r\vp^\ast $, a stąd i z Twierdzenia [link] otrzymujemy równoważności

$ \vp $ jest monomorfizmem $ \iff $ $ \r\vp=\dim V $ $ \iff $ $ \r\vp^\ast=\dim V^\ast $ $ \iff $ $ \vp^\ast $ jest epimorfizmem

oraz

$ \vp $ jest epimorfizmem $ \iff $ $ \r\vp=\dim W $ $ \iff $ $ \r\vp^\ast=\dim W^\ast $ $ \iff $ $ \vp^\ast $ jest monomorfizmem. □