 Ha szélsőértékhelyeket keresünk csak első deriválttal, akkor igazából kizárásos alapon találjuk meg a szélsőértékhelyeket. Olyan, mint egy klasszikus krimitörténet.
Valahonnan tudjuk hogy bűncselekmény történt: valaki betört az MNB-be és felvette a maximumot. Rajta kívül egy idióta is betört, de ő a minimumot vette fel. Az egyiket börtönbe akarjuk zárni, a másikat diliházba. Mondjuk van egy folytonos f:[0,1]→R függvényünk: ennek a Weierstrass-tétel miatt biztosan van legnagyobb és legkisebb értéke.
A felügyelő kikérdezi az összes gyanúsítottat, vagyis az összes [0,1]-beli pontot, hogy milyen alibije van. Aki igazolni tudja, hogy ő egy olyan belső pont, ahol f differenciálható, és a derivált nem nulla, annak alibije van: az ilyen helyeken a függvény lokálisan szig. növekvő/csökkenő, így biztosan nincs szélsőérték sem.
A film utolsó részében összegyűjtjük azokat, akiknek nincs alibije: az intervallum végpontjait, azokat a belső pontokat, ahol a függvény nem differenciálható, vagy éppen differenciálható, de a derivált nulla. Ha szerencsénk van, akkor kevés (véges sok) gyanúsított maradt: ezeket kikérdezzük, vagyis behelyettesítjük a függvénybe. Így kiderül, hogy hol van a maximum és minimum, és kik azok a gyanúsítottak, akik csak rosszkor voltak rossz helyen.
A Lagrange-multiplikátor módszer is ugyanilyen, bizonyos pontoknak alibit biztosít. Annyit állít, hogy azok a pontok, ahol az összes feltétel (egyenlet) teljesül, a feltételek és a célfüggvény folytonosan differenciálható (ehelyett az is elég, ha abban a pontban differenciálhatóak és egy környezeben foytonosak), továbbá a feltételek és a célfüggvény gradiens vektorai lineárisan függetlenek, ott nincs feltételes lokális szélsőértékhely. Ezt persze megfordítva szoktuk használni: ahol feltételes lokális szélsőértékhely van, ott a gradiensvektorok vagy nem is léteznek, vagy lineárisan összefüggőek, tehát valamelyik felírható a többi gradiens egy lineáris kombinációjaként; ebben a lin. kombinációban szereplő együtthatók a "Lagrange-multiplikátorok".
* * *
Téged persze a második derivált szerepe érdekel; sajnos a szinguláris pontokban, ahol feltételek gradiensvektorai lineárisan összefüggőek, ott az egyenletrendszer lokális megoldásai többnyire nem adnak szép felületdarabot. Akár már egyetlen feltétel/egyenlet esetén is, ahol a derivált a nullvektor, ronda lehet a megoldáshalmaz.
A reguláris pontokban, ahol az egyenleteink gradiensvektorai függetlenek, ott az implicitfüggvény-tétel szerint van szép lokális megoldás, felületdarab, és néhány változó egyértelműen meghatározza a többit. Lehetséges egy ügyesen összerakott függvény második deriváltmátrixának definitségét vizsgálni. Ehhez mindenféle parciális derivált mátrixokkal és inverzeikkel kell számolni. Nem szép, de legalább lehetséges...
* * *
A legegyszerűbb eset persze a 2 változó, 1 feltétel. Legyen f(x,y)=0 a feltétel; ezen a "görbén" keressük egy g(x,y) függvény lokális szélsőértékeit. Tegyük fel, hogy egy (a,b) rajta van a görbén, tehát f(a,b)=0, és a pont egy környezetében f és g is kétszer differenciálható. És azt is tegyük fel, hogy (a,b) a görbének nem szinguláris pontja, vagyis legalább az egyik parciális derivált nem 0; mondjuk az y-szerinti. (A parciáls deriváltakat alsó indexekkel fogom jelölni, tehát f2(a,b) az f második változó szerinti parciális deriváltja: f2(a,b)≠0.)
Az implicitfüggvény-tétel szerint van (a,b) körül egy A×B téglalap, amelyben görbénk egy függvény grafikonja: van egy egyértelmű h:A→B implcit függvény, ami megoldása az f(x,h(x))=0 egyetletnek; ez a h(x) függvény differenciálható is, és
h′(x)=−f1(x,h(x))f2(x,h(x)).
A függvényt akár még egyszer differenciálhatjuk, ebből látjuk, hogy a h(x) függvény kétszer is differenciálható.
Minket az érdekel, hogy a G(x)=g(x,h(x)) függvénynek milyen szélsőértéke lehet az a pontban.
A számolást úgy lehet szebben leírni, hogy magát az f(x,h(x))=0 azonosságot és a G(x)=g(x,h(x)) függvényt deriváljuk kétszer az a pontban:
f1(a,b))+f2(a,b)⋅h′(a)=0
f11(a,b))+2f12(a,b))⋅h′(a)+f22(a,b))⋅h′(a)2+f2(a,b))⋅h″
\displaystyle G'(a) =
g_1(a,b) + g_2(a,b)\cdot h'(a)
\displaystyle G''(a) =
g_{11}(a,b)) + 2g_{12}(a,b)\cdot h'(a) + g_{22}(a,b))\cdot h'(a)^2 + g_2(a,b)) \cdot h''(a)
Az első kettőből kifejezhetjük \displaystyle h'(a) és \displaystyle h''(a) értékét; mindkét esetben \displaystyle f_2(a,b)-vel kell osztani, ami nem nulla; a \displaystyle G'(a) akkor nulla, ha a két gradiens párhuzamos; végül megkapjuk \displaystyle G''(a) értékét, és megvizsgálhatjuk az előjelét...
|