Zajmiemy się teraz określeniem pochodnych cząstkowych rzędu wyższego niż pierwszy, różniczek wyższych rzędów, oraz uogólnieniem wzoru Taylora na funkcje wielu zmiennych. Podobnie jak w przypadku funkcji jednej zmiennej, wzór Taylora pozwala znajdować najlepsze przybliżenia wielomianowe funkcji, a także prowadzi do warunków dostatecznych, gwarantujących, że w punkcie krytycznym funkcja ma ekstremum lokalne.
Jak można się spodziewać, pochodne cząstkowe wyższych rzędów definiuje się indukcyjnie.






![]() |
Będziemy też używać innych oznaczeń:
![]() |
Uwaga. Posługując się oznaczeniami , przestrzegamy naturalnej mnemotechnicznej konwencji: najpierw różniczkujemy względem tej zmiennej, która jest zapisana bliżej
.
Pochodne cząstkowe wyższych rzędów definiuje się analogicznie, np.
![]() |
stosując inne oznaczenia, napisalibyśmy oraz
![]() |
Stosowanie wszelkich oznaczeń tego typu dla pochodnych cząstkowych rzędu wyższego niż drugi jest w praktyce dość niewygodne. Dlatego później poznamy jeszcze inną, wygodną i bardzo skrótową konwencję notacyjną. Najpierw jednak omówimy najważniejsze własności pochodnych cząstkowych drugiego rzędu.
Przykład Peano i twierdzenie Schwarza o równości pochodnych mieszanych
Bardzo naturalne jest pytanie: czy, wprowadzając oznaczenia pochodnych cząstkowych drugiego rzędu, trzeba rzeczywiście koniecznie odróżniać od
? Czytelnik, oswojony już nieco z przykładami patologicznego zachowania funkcji wielu zmiennych, może spodziewać się, że odpowiedź jest twierdząca.
![]() |
W punktach funkcja
jest różniczkowalna. Ponadto,
![]() |
korzystając z tej nierówności, sprawdza się łatwo (wprost z definicji różniczki), że . Obliczymy teraz pochodne mieszane
i
.
Mamy
![]() |
gdyż (pamiętajmy: różniczka
znika w zerze). Wartość
obliczamy, posługując się definicją
; aby nie wykonywać długich rachunków, zauważmy, że
ma w zerze pochodną
i dlatego
![]() |
Zatem . Zamieniając
rolami, otrzymujemy w ten sam sposób
i
. Jest więc
.
Podobny (bardziej skomplikowany) przykład podał H.A. Schwarz nieco wcześniej. Okazuje się jednak, że takie zachowanie jest wykluczone wówczas, gdy pochodne mieszane są ciągłe.








Dowód poprzedzimy kilkoma lematami.
![$ Q=[a,b]\times[c,d]\subset \R^2 $](/sites/default/files/tex/bc4d0b91b22bb9cbcf2473e6acdacd3d62dd7e81.png)



![]() |
jest funkcją różniczkowalną i zachodzi wzór
![]() |
![]() |
Dlatego iloraz różnicowy funkcji jest równy
![]() |
Oznaczmy literą całkę po prawej stronie wzoru pochcalki. Ponieważ
, więc
![]() |
Funkcja jest ciągła na zbiorze zwartym
, a więc jest jednostajnie ciągła na
. Ustalmy
i dobierzmy
tak, aby
dla
. Wówczas, dla
, funkcja podcałkowa w lempomost jest w każdym punkcie mniejsza od
i otrzymujemy
![]() |
Wprost z definicji granicy, dla
, tzn. istotnie zachodzi wzór pochcalki. □

![$ Q=[a,b]\times[c,d]\subset\Omega $](/sites/default/files/tex/629edc6756fcde0df2e6a0ddf7e6b5379022594b.png)









![]() |
gdzie funkcja jest ciągła na
i ma pochodną
ciągłą na
. Różniczkując powyższy wzór względem
i stosując poprzedni lemat do
, otrzymujemy
![]() |
Zatem
![]() |
Dla lewa strona dąży do
, prawa zaś do wartości funkcji podcałkowej wpunkcie
, tzn. do
(tu ponownie korzystamy z ciągłości
i z twierdzenia owartości średniej dla całki). Dowód jest zakończony w przypadku
.
Gdy , to z pierwszej części dowodu wynika, że wszystkie współrzędne pochodnej
są dobrze określone i równe odpowiednim współrzędnym
. □
Dowód Twierdzenia [link] Dla zbiorów twierdzenie wynika natychmiast z ostatniego lematu. Jeśli
, to zauważmy, że aby określić pochodne
oraz
w punkcie
, wystarczy znać wartości
jedynie na dwuwymiarowej płaszczyźnie afinicznej
. Stosując Lemat [link] na przecięciach zbioru
z takimi płaszczyznami, łatwo otrzymujemy tezę. □
Druga różniczka
Zacznijmy od objaśnienia, jakim obiektem matematycznym miałaby być druga różniczka funkcji wielu zmiennych. Przypuśćmy, że
jest różniczkowalna na
. Dla ustalonego
jej różniczka
jest elementem przestrzeni
, którą, ustaliwszy bazy w
i
, można utożsamiać z
lub
. Inaczej mówiąc,
![]() |
Naturalnie byłoby określić drugą różniczkę jako
(wszędzie tam, gdzie
sama jest funkcją różniczkowalną). Zgodnie z definicją różniczki, powinno wtedy być
![]() |
tzn. powinna być, dla ustalonego
, przekształceniem liniowym z
w przestrzeń, do której należą wartości różniczkowanej funkcji
, tzn.
. Brzmi to zawile i widać od razu, że definiowanie różniczek wyższych rzędów prowadziłoby do coraz dłuższych napisów (i coraz bardziej skomplikowanych przestrzeni liniowych). Dlatego korzysta się z naturalnego izomorfizmu
![]() |
między przestrzenią i przestrzenią
przekształceń dwuliniowych
. Jest to izomozfizm kanoniczny, tzn. zdefinowany bez odwoływania się do układu współrzędnych, za pomocą wzoru
![]() |
gdzie
![]() |
Sprawdzenie, że to rzeczywiście izomorfizm, jest łatwym ćwiczeniem.



![]() |
jest różniczkowalna w punkcie , to przekształcenie dwuliniowe
![]() |
nazywamy drugą różniczką funkcji w punkcie
.






![]() |
gdzie lewą stronę interpretujemy jako wartość przekształcenia dwuliniowego dla pary wektorów , prawą zaś jako wynik mnożenia trzech macierzy, o rozmiarach (odpowiednio)
,
i
.
Z twierdzenia Schwarza o równości pochodnych mieszanych wynika natychmiast, że jeśli ma ciągłe pochodne cząstkowe do rzędu 2 włącznie, to
jest funkcją różniczkowalną i dla każdego
macierz przekształcenia dwuliniowego
jest macierzą symetryczną, gdyż
. Okazuje się jednak, że tak jest również wtedy, gdy
po prostu istnieje; nie trzeba zakładać ciągłości pochodnych mieszanych w pewnym otoczeniu punktu
.





![]() |


![]() |
określoną dla w pewnym otoczeniu zera. Mamy
; z twierdzenia o wartości średniej wynika, że \begin{multline} \|\phi(s,t)\|=\|\phi(s,t)-\phi(0,t)\|\le |s| \sup_{\sigma\in [0,s]}\norm{\phi_s(\sigma,t)} \\ = |s| \sup_{\sigma\in [0,s]}\norm{\Big(Df(\aa+t\ww+\sigma\vv)-Df(\aa+\sigma\vv) \Big)\cdot\vv - tD^2f(\aa)(\ww,\vv)}\, . (#) \end{multline} Ponieważ
istnieje, więc
, gdzie
dla
(patrz Stwierdzenie [link]). Podstawiając w tej równości wektory
i
, otrzymujemy
![]() |
Odejmując oba wzory stronami i pamiętając o izomorfizmie przestrzeni oraz
, sprawdzamy, że \begin{multline} \Big(Df(\aa+t\ww+\sigma\vv)-Df(\aa+\sigma\vv) \Big)\cdot\vv - tD^2f(\aa)(\ww,\vv) \\= \big(\|\hh_1\|r(\hh_1)-\|\hh_2\|r(\hh_2)\big) \cdot \vv\, . (#) \end{multline} Niech odtąd
. Wtedy
, co daje oszacowania
dla
oraz
![]() |
Korzystając ze wzorów D22- resztaD2, przepisujemy dla nierówność D21 w postaci
![]() |
Innymi słowy, dla
, lub równoważnie
![]() |
Prawa strona wzoru symetriaD2 nie zmienia się, gdy zamienimy wektory rolami. Dlatego lewa strona też musi być symetryczną funkcją
i
, tzn.
. □
- {\alph{enumi})}
- Jeśli
, gdzie
jest ustalonym przekształceniem liniowym, to
jest przekształceniem stałym i dlatego
.
- Jeśli
gdzie
jest macierzą
, to ze wzoru na pochodną `iloczynu' otrzymujemy
co oznacza, że
dla wszystkich
. (Pisząc wzór
, utożsamiamy funkcjonał liniowy
z wektorem
.) Zatem,
zależy od
liniowo i mamy
. Jeśli
, tzn. macierz
jest symetryczna, to
.
Różniczki wyższych rzędów
Różniczki wyższych rzędów definiuje się indukcyjnie, wzorem
![]() |
Aby definicja miała sens, różniczka rzędu
powinna być funkcją określoną w otoczeniu punktu
i różniczkowalną w
. Różniczka
-tego rzędu,
jest przekształceniem
-liniowym z
w
, tzn.
![]() |
Wartość , która jest wektorem z
, zależy liniowo od każdego zwektorów
(
) z osobna. Taka interpretacja różniczki
-tego rzędu jest rzeczą naturalną: jeśli
![]() |
gdzie
![]() |
oznacza przestrzeń przekształceń -liniowych z
w
, to zgodnie z definicją różniczki
![]() |
Jednak przestrzenie
![]() |
można utożsamić; ich naturalnym izomorfizem jest przekształcenie , gdzie
i
powiązane są zależnością
![]() |

![]() |
dla każdej permutacji zbioru
-elementowego. Mozna to udowodnić przez indukcję względem
, posługując się twierdzeniem Schwarza o symetrii drugiej różniczki.
![]() |
dla oznaczenia wartości -tej różniczki (która jest przekształceniem
-liniowym) na układzie
identycznych wektorów.
Aby wszystkie rachunki w następnym podrozdziale Czytelnik mógł prześledzić ze zrozumieniem, wprowadzimy jeszcze jedną definicję.

![]() |
nazywamy najmniejszą stałą taką, że
![]() |
Zapisywanie różniczek wyższych rzędów we współrzędnych jest zajęciem niewdzięcznym i nie będziemy tego robić. Wygodną metodę oznaczania pochodnych cząstkowych wyższych rzędów podamy w następnym podrozdziale.
Wzór Taylora. Funkcje klasy
i notacja wielowskaźnikowa.
Okazuje się, że przy odpowiedniej notacji, wprowadzonej wyżej, wzór Taylora w najprostszej wersji, z resztą w postaci Peano, wygląda zupełnie tak samo, jak dla funkcji jednej zmiennej.







![]() |
gdzie dla
.
![]() |
stosując razy twierdzenie o wartości średniej. Zauważmy, że
, a ponadto
![]() |
Mamy więc , \ldots,
. Korzystając z Twierdzenia [link], otrzymujemy nierówności
![]() |
Normę trzeba oszacować inaczej, gdyż
istnieje tylko w punkcie
. Można jednak skorzystać po prostu z definicji różniczki; wobec wzoru na
mamy
![]() |
Łącząc tę nierówność z TayDk-1, otrzymujemy dla
. □
W praktyce wygodnie jest znać także inne postacie wzoru Taylora. Jedną z nich, używającą tzw. notacji wielowskaźnikowej, podajemy niżej.
\subsubsection*{Notacja wielowskaźnikowa. Funkcje klasy .}








Za pomocą wielowskaźników wygodnie jest oznaczać pochodne cząstkowe wyższych rzędów w takich sytuacjach, gdy kolejność wykonywania poszczególnych różniczkowań nie ma znaczenia.










![]() |
są dobrze określone i ciągłe na zbiorze . Można to udowodnić, posługując się Twierdzeniem [link]. Jest to dość łatwe: rozumowanie wymaga tylko znajomości pojęć i nie są potrzebne żadne rachunki.
Umowa. Dla funkcji symbol
![]() |
oznacza pochodną cząstkową tej funkcji, rzędu , przy czym różniczkowanie względem zmiennej
wykonujemy
-krotnie (
). Z twierdzenia Schwarza o równości pochodnych mieszanych wynika, że dla funkcji klasy
kolejność wykonywania różniczkowań nie odgrywa roli; można więc w ten sposób oznaczać wszystkie pochodne cząstkowe takiej funkcji, bez obawy, że nie wiadomo, o jaką pochodną chodzi. Przyjmujemy także
![]() |




![]() |
dla , gdzie reszta
![]() |
Uwaga. We wzorze Tay-calk sumowanie po prawej stronie odbywa się względem wszystkich wielowskaźników długości .




![$ t\in [0,1] $](/sites/default/files/tex/492f43f1424c861d5c070025d863c16519c84d50.png)


![$ I\supset [0,1] $](/sites/default/files/tex/dbccda3b160f49c05a6e5d46782bc1e5d4f06910.png)
![]() |
Aby zakończyć pracę, wyrazimy pochodne funkcji przez pochodne cząstkowe funkcji
. Posługując się wzorem na pochodną złożenia, dowodzimy przez indukcję, że
![]() |
itd.; ogólnie,
![]() |
Ostatnią sumę zapiszemy, używając notacji wielowskaźnikowej. Ustalmy wielowskaźnik taki, że
. Liczba takich ciągów
o wyrazach ze zbioru
, w których
,
, \ldots,
wystepują (odpowiednio)
-krotnie,
-krotnie, \ldots,
krotnie, wynosi, zgodnie ze znanym wzorem kombinatorycznym,
![]() |
Dla każdego z tych ciągów mamy
![]() |
a więc wzór gs-dluga można przepisać w postaci
![]() |
Podstawiając gs-krotka do wzoru Taylor-g, otrzymujemy tezę twierdzenia. □
W szczególnym przypadku , dla funkcji
różniczkowalnej dwukrotnie w sposób ciągły, można podobnie (stosując wzór Taylora z resztą Lagrange'a dla funkcji
jednej zmiennej
) uzyskać następujący fakt.


![]() |
Wskazówka. Oznaczyć lewą stronę i zastosować wzór Taylora.
Ekstrema lokalne.
Wiemy już, że warunkiem koniecznym, by funkcja różniczkowalna miała ekstremum w punkcie
, jest znikanie jej gradientu w tym punkcie. Zajmiemy się teraz sformułowaniem warunków dostatecznych istnienia ekstremum lokalnego funkcji klasy
. Wyrazimy je za pomocą własności drugiej różniczki.

![]() |
nazywamy hesjanem funkcji w punkcie
.
Z twierdzenia Schwarza o równości pochodnych mieszanych wynika natychmiast, że jest macierzą symetryczną. Jak wiadomo z wykładów Algebry Liniowej, wszystkie wartości własne macierzy symetrycznej
są rzeczywiste, a w
istnieje baza ortonormalna, złożona z wektorów własnych
.
Przypomnijmy, że macierz symetryczna nazywa się dodatnia (ujemna) wtedy i tylko wtedy, gdy
dla
(odpowiednio
dla
). Macierze nieujemne i niedodatnie definiuje się analogicznie, za pomocą nierówności nieostrych. Jeśli
jest dodatnia (ujemna, nieujemna, niedodatnia), to piszemy
(odpowiednio:
,
,
).










![]() |
dla wszystkich dostatecznie małych. Ustalmy
i podstawmy w tej nierówności
, gdzie
i
. Dzieląc obie strony przez
, otrzymujemy
![]() |
Przechodząc do granicy i korzystając z ciągłości drugich pochodnych cząstkowych
otrzymujemy
.
Jeśli ma w
maksimum lokalne, to rozpatrujemy funkcję
, która ma w tym punkcie minimum lokalne. □
Przydatna w praktyce jest oczywiście implikacja odwrotna.




- {(\roman{enumi})}
- Jeśli
w pewnym otoczeniu punktu
, to
ma w
minimum lokalne.
- Jeśli
, to
ma w
minimum lokalne właściwe.
- Jeśli
w pewnym otoczeniu punktu
, to
ma w
maksimum lokalne.
- Jeśli
, to
ma w
maksimum lokalne właściwe.


![]() |
gdzie . Z tej równości natychmiast wynikaja podpunkty (i) oraz (iii) Twierdzenia [link].
Załóżmy teraz, że . Funkcja
jest wtedy dodatnia i ciągła na sferze jednostkowej
, która jest zbiorem zwartym. Wobec twierdzenia Weierstrassa o przyjmowaniu kresów, istnieją stałe
takie, że
![]() |
Podstawiając w tej nierówności , gdzie
jest dowolnym wektorem różnym od
, otrzymujemy
![]() |
Dlatego, z nierówności Schwarza i definicji normy macierzy,
![]() |
Ponieważ , więc wszystkie współrzędne macierzy
zależą od
w sposób ciągły. Istnieje zatem liczba
taka, że jeśli
i
, to
![]() |
Wtedy jednak, wobec nierHobok,
![]() |
To dowodzi punktu (ii). Dowód (iv) jest taki sam. □









Zanim przejdziemy do przykładów, przytoczymy jeszcze twierdzenie, które pozwala wnioskować, kiedy z pewnością nie ma ekstremum lokalnego w punkcie krytycznym.













![]() |
Mamy , tzn.
, oraz
![]() |
Zatem . Podobnie,
. Dlatego
ma minimum lokalne właściwe w zerze, a
ma maksimum lokalne właściwe w zerze. Wynika stąd, że
nie ma ekstremum lokalnego w punkcie
(gdyby miała, to każda z funkcji
miałaby w zerze ekstremum lokalne tego samego typu, co
). □
To, czy macierz jest dodatnia (ujemna), można rozpoznawać za pomocą kryterium Sylvestera.



![]() |
- {(\roman{enumi})}
- Jeśli
dla każdego
, to
.
- Jeśli
dla każdego
, to
.
- Jeśli
dla każdego
, ale nie zachodzi ani założenie(i), ani założenie(ii), to macierz
ma wartości własne różnych znaków.
Dowód Czytelnik miał okazję poznać na wykładach z Algebry Liniowej. Zainteresowanym polecam książkę A. Mostowskiego i M. Starka Elementy algebry wyższej.







![]() |
ma (jedyny) punkt krytyczny w . Jest oczywiste, że dla funkcji
ten punkt jest minimum lokalnym właściwym, dla
- maksimum lokalnym właściwym, natomiast
w ogóle nie ma tym punkcie ekstremum lokalnego. Mamy jednak
![]() |
Biorąc
![]() |
otrzymamy
![]() |
Łatwo zauważyć, że w punkcie funkcja
ma minimum lokalne właściwe,
- minimum lokalne (które nie jest właściwe), natomiast
w ogóle nie ma ekstremum.





Pochodne cząstkowe funkcji są równe
![]() |
więc (niezależnie od wartości parametru ) jest
i
ma w zerze punkt krytyczny. Dalej, obliczamy
TeX Embedding failed! |
Podstawiając otrzymujemy
![]() |
Jeśli , to
i z kryterium Sylvestera wynika, że macierz
jest dodatnio określona, a więc
ma minimum lokalne właściwe w punkcie
(patrz Twierdzenie [link](ii)).
Ilustracja do Przykładu [link]. Parametr . Mamy wówczas
dla
, gdzie
![]() |
jest wielomianem Taylora rzędu 3 funkcji wokół zera. Po lewej: poziomice funkcji
, narysowane na płaszczyźnie
(w dziedzinie funkcji). Zbiór punktów w
, opisany równaniem
, to krzywa z wyraźnym dziobkiem. Po prawej: fragment wykresu funkcji
, tzn. powierzchnia w
o równaniu
.
Jeśli , to
. Macierz
ma więc wartości własne różnych znaków i wobec Twierdzenia [link]
nie ma w zerze ekstremum lokalnego.
Przypadek trzeba rozpatrzeć osobno. Macierz
ma wtedy wartości własne
i
, więc nie jest dodatnia i nie wolno stosować Twierdzenia [link](ii); jak wynika z wcześniej przytoczonych przykładów, w takiej sytuacji funkcja może zarówno mieć ekstremum lokalne, jak i go nie mieć.
Dla ustalenia uwagi, niech . Użyjemy wzoru Taylora (najprościej jest w tym przypadku wykorzystać znane rozwinięcia funkcji elementarnych) i napiszemy
![]() |
Na prostej mamy więc \( h(x,-x\sqrt 2) = -x^3 + o(x^3),\) \( \ x\to 0. \) Zatem,
nie ma ekstremum w zerze: wyrazy trzeciego rzędu we wzorze Taylora powodują, że
zmienia znak w każdym otoczeniu
, a przecież
. Przypadek
sprawdza się tak samo; Czytelnik łatwo uzupełni szczegóły obliczeń.
Czytelnik może sprawdzić, że kierunek prostej jest wyznaczony przez wektor
taki, że
. W innych kierunkach hesjan ma dodatnie wartości. Sprawdzaliśmy więc w istocie, jak zachowuje się funkcja
wokół zera ``w podejrzanym kierunku'' - i to wystarczyło, by stwierdzić brak ekstremum lokalnego. □
Ilustracja do Przykładu [link]. Krzywe na płaszczyźnie
. W punkcie krytycznym
spotykają się dwa szerokie grzbiety i dwie wąskie, wygięte doliny. W Przykładzie [link] wystarczyło użyć twierdzeń [link] i [link] (dających automatyczne kryteria badania funkcji wokół punktu krytycznego), a w wątpliwym przypadku zbadać zachowanie funkcji na prostych, przechodzących przez punkt krytyczny. Pod\-kreślmy jednak, że z zachowania funkcji na poszczególnych takich prostych nie wolno wnioskować, że ma ona ekstremum lokalne!
![]() |
dla . Wtedy \begin{align*} g_x (x,y)&=18 x^5 - 12 x^2 y, \\ g_y(x,y)&=-4 x^3 + 2 y,\\ g_{xx}(x,y) &= 90 x^4 - 24 x y, \\ g_{xy}(x,y)&=-12x^2,\\ g_{yy}(x,y)&=2. \end{align*} Zatem funkcja
ma w zerze (jedyny) punkt krytyczny;
![]() |
Na każdej prostej jest
dla
, a więc obcięcie funkcji
do takiej prostej ma w zerze minimum lokalne (właściwe). Na prostej
jest
(tzn. znów mamy funkcję jednej zmiennej, która ma minimum w zerze). Jednak na krzywej
jest
, a więc w dowolnie małym otoczeniu zera funkcja
przyjmuje nie tylko wartości dodatnie, ale także ujemne.