Ortogonalność w przestrzeniach euklidesowych

Dwa wektory w geometrii są prostopadłe jeśli ich iloczyn skalarny jest zerem. Tę własność przyjmiemy jako określenie prostopadłości wektorów w liniowych przestrzeniach euklidesowych, przy czym zgodnie z \nolinebreak powszechnie przyjętą terminologią, będziemy raczej mówili o ortogonalności.

Definicja (#) Wektory $ \al, \be $ w liniowej przestrzeni euklidesowej są ortogonalne (lub prostopadłe) jeśli $ \is{\al}{\be}=0 $, co zapisujemy $ \al\perp\be $.

Ortogonalność podprzestrzeni $ U,W $ przestrzeni $ V $, $ U\perp W $, oznacza, że $ \ga\perp\be $ dla dowolnych $ \ga\in U $ i \nolinebreak $ \be\in W $. W szczególności, ortogonalność wektora $ \ga $ do podprzestrzeni $ W $, $ \ga\perp W $ oznacza, że $ \lin(\ga)\perp W $.

Uwaga Jeśli $ U\perp W $, to $ U\cap W=\set{\0} $, bo zgodnie z [link] (4), $ \al\perp\al $ oznacza, że $ \al=\0 $. Jeśli ponadto $ V=U\oplus W $, to będziemy

mówić, że $ V $ jest sumą ortogonalną podprzestrzeni $ U $ i $ W $.

Z własności iloczynu skalarnego i określenia długości wektorów wynika natychmiast formuła Pitagorasa

$ \al\perp \be\quad \iff \quad ||\al-\be||^2=||\al||^2+||\be||^2 $.

Bez założenia ortogonalności mamy $ ||\al-\be||^2= ||\al||^2+||\be||^2-2\is{\al}{\be} $. Definiując kąt między niezerowymi wektorami $ \al,\be $ jako liczbę $ \theta\in[0,\pi] $ taką, że $ \cos\theta=\frac{\is{\al}{\be}}{||\al||\,||\be||} $ (z \nolinebreak nierówności \nolinebreak Schwarza wynika, że ułamek po prawej stronie jest w przedziale $ [-1,1] $) otrzymujemy stąd twierdzenie cosinusów:

$ ||\al-\be||^2= ||\al||^2+||\be||^2-2\cos\theta\,||\al||\, ||\be||. $

Definicja Układ wektorów $ (\al_1,\ldots,\al_n) $ w liniowej przestrzeni euklidesowej $ (V,\is{\ }{\,}) $ jest ortogonalny jeśli $ \al_i\perp\al_j $ dla $ i\neq j $.
Uwaga Ortogonalny układ niezerowych wektorów $ (\al_1,\ldots,\al_n) $ jest liniowo niezależny, bo jeśli $ \sum_i a_i\al_i=\0 $, to dla każdego $ j $, $ \0=\is{\sum_i a_i\al_i}{\al_j}=\sum_i a_i\is{\al_i}{\al_j}=a_j||\al_j||^2 $, a więc $ a_j=0 $.
Definicja Ortogonalny układ wektorów niezerowych $ (\al_1,\ldots,\al_n) $ w przestrzeni $ (V,\is{\ }{\,}) $ rozpinający $ V $ nazywamy bazą ortogonalną w $ V $; jeśli dodatkowo $ ||\al_j||=1 $, $ j=1,\ldots,n $, mówimy, że układ $ (\al_1,\ldots,\al_n) $ jest bazą ortonormalną $ V $.

Pokażemy teraz, że każda liniowa przestrzeń euklidesowa ma bazę ortogonalną. Co więcej, opiszemy procedurę - ortogonalizację Grama-Schmidta pozwalającą przyporządkować każdemu układowi liniowo niezależnemu układ ortogonalny, bez zmiany powłoki liniowej.

Twierdzenie (#){(ortogonalizacja Grama-Schmidta).} Niech $ (\al_1,\ldots,\al_n) $ będzie liniowo niezależnym układem wektorów w liniowej przestrzeni euklidesowej $ (V,\is{\ }{\,}) $. Określmy indukcyjnie wektory $ \be_1,\ldots,\be_n $ formułą

\[ \be_1=\al_1 , \quad \be_{k}= \al_{k}-\sum_{i=1}^{k-1}\frac{\is{\al_{k}}{\be_i}}{\is{\be_i }{\be_i}}\be_i. \]

Wówczas

\[ w_i\perp w_j \mbox{ dla } i\neq j, \end{equation} \begin{equation} \lin(\be_1,\ldots,\be_j)=\lin(\al_1,\ldots,\al_j),\ j=1,\ldots,n. \]
Dowód: Załóżmy, że układ $ (\be_1,\ldots,\be_{k-1}) $ został już określony tak, że (3) jest spełnione dla $ j<k $. Mamy pokazać, że dla $ \be_{k} $ określonego formułą (1) układ $ (\be_1,\ldots,\be_{k}) $ jest ortogonalny i spełnia (3) dla $ j=k $. Ta ostatnia własność wynika z faktu, że $ \be_{k}-\al_{k}\in \lin(\be_1,\ldots,\be_{k-1})=\lin(\al_1,\ldots,\al_{k-1}) $, zob.\ (1).

Niech $ j<k $. Sprawdzimy, że $ \be_j\perp\be_{k} $. Istotnie, z (1) i (2),

$ \is{\be_j}{\be_{k}}= \is{\be_j} {\al_{k}-\sum_{i<k} \frac{\is{\al_{k}}{\be_i}}{\is{\be_i}{\be_i}}\be_i}= \is{\be_j}{\al_{k}}-\sum_{i<k} \frac{\is{\al_{k}}{\be_i}}{\is{\be_i}{\be_i}}\is{\be_j}{\be_i}= \is{\be_j}{\al_{k}}- \frac{\is{\al_{k}}{\be_j}}{\is{\be_j}{\be_j}}\is{\be_j}{\be_j}=0 $

Wyjaśnimy teraz, że w opisanej wyżej procedurze ortogonalizacji, na każdym kroku znajdujemy wektor $ \be_k $ odejmując od wektora $ \al_k $ rzut ortogonalny $ \al_k $ na podprzestrzeń rozpiętą przez poprzednie wektory.

Twierdzenie (#) Niech $ W $ będzie podprzestrzenią liniowej przestrzeni euklidesowej $ (V,\is{\ }{\,}) $. Istnieje wówczas przekształcenie liniowe $ P:V\to V $ - rzut ortogonalny $ V $ na $ W $, takie, że

$ (1) $\qquad $ P(\be)=\be $ dla $ \be\in W $

$ (2) $\qquad $ \al-P(\al)\perp W $ dla $ \al\in V $.

Dowód: Zgodnie z Twierdzeniem [link] możemy wybrać układ ortogonalny $ \be_1,\ldots,\be_m $ rozpinający $ W $ i \nolinebreak niech

$$P(\al)=\sum_{i=1}^{m}\frac{\is{\al}{\be_i}}{\is{\be_i}{\be_i}}\be_i.$$

Podobnie jak w dowodzie [link], dla $ j\leq m $,

$ \is{\be_j}{\al-P(\al)}= \is{\be_j} {\al-\sum_{i\leq m} \frac{\is{\al}{\be_i}}{\is{\be_i}{\be_i}}\be_i}= \is{\be_j}{\al}-\sum_{i\leq m} \frac{\is{\al}{\be_i}}{\is{\be_i}{\be_i}}\is{\be_j}{\be_i}= \is{\be_j}{\al}- \frac{\is{\al}{\be_j}}{\is{\be_j}{\be_j}}\is{\be_j}{\be_j}=0 $,

a stąd $ \is{\be}{\al-P(\al)}=0 $ dla $ \be=\sum_{j\leq m} a_j\be_j\in W $, czyli (2).

Jeśli $ \be\in W $, to $ \be-P(\be)\in W $ i z (2), $ \is{\be-P(\be)}{\be-P(\be)}=0 $, co daje $ \be-P(\be)=\0 $, czyli (1). □

Uwaga (#) Zauważmy, że w sytuacji opisanej w Twierdzeniu [link], dla $ \al\in V $, warunki $ \be\in W $ oraz $ \al-\be\perp W $ charakteryzują wektor $ \be $ jednoznacznie, co więcej jest to jedyny wektor z $ W $ taki, że $ ||\al-\be||=\inf\set{||\al-\ga||:\ga\in W} $. Istotnie, dla $ \ga\in W $, $ \ga-\be\in W $, więc $ (\al-\be)\perp (\be-\ga) $ i z formuły Piagorasa, $ ||\al-\ga||^2=||(\al-\be)+(\be-\ga)||^2= ||\al-\be||^2+||\be-\ga||^2\geq ||\al-\be||^2 $, przy czym dla $ \ga\neq \be $ nierówność jest ostra.

Tak więc rzut ortogonalny $ P:V\to W $ można opisać jako przekształcenie, które dla każdego wektora $ \al\in V $ wybiera z $ W $ (jedyny) wektor $ P(\al) $ minimalizujący długości $ ||\al-\ga|| $, $ \ga\in W $.

Jak zobaczymy za chwilę, istnienie rzutu ortogonalnych pozwala uzupełnić każdą podprzestrzeń liniowej przestrzeni euklidesowej składnikiem prostym, ortogonalnym do tej przestrzeni.

Twierdzenie (#) Niech $ W $ będzie podprzestrzenią liniowej przestrzeni euklidesowej $ (V,\is{\ }{\,}) $ i niech $ W^\perp=\set{\al\in V:\al\perp W} $. Wówczas $ V=W\oplus W^\perp $ jest sumą ortogonalną.
Dowód: Niech $ P:V\to W $ będzie rzutem ortogonalnym na $ W $. Zauważmy, że $ \im P=W $ oraz $ \ker P=W^\perp $. Ponieważ $ W\cap W^\perp=\set{\0} $ i $ \dim V=\d P+\r P $, więc $ V=W\oplus W^\perp $ i oczywiście $ W\perp W^\perp $. □

Podprzestrzeń $ W^\perp $ nazywamy dopełnieniem ortogonalnym przestrzeni $ W $ w $ V $. Zauważmy, że rzut ortogonalny $ V $ na $ W $ jest rzutem na $ W $ równoległym do $ W^\perp $ zdefiniowanym w [link]. Symetrię względem $ W $ równoległą do $ W^\perp $ nazywamy symetrią ortogonalną względem $ W $.