We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Differentialrechnung in mehreren Variablen - Teil 5

00:00

Formale Metadaten

Titel
Differentialrechnung in mehreren Variablen - Teil 5
Serientitel
Teil
16
Anzahl der Teile
25
Autor
Lizenz
CC-Namensnennung - keine kommerzielle Nutzung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen und nicht-kommerziellen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen und das Werk bzw. diesen Inhalt auch in veränderter Form nur unter den Bedingungen dieser Lizenz weitergeben.
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache

Inhaltliche Metadaten

Fachgebiet
Genre
AnalysisMathematikDifferentialrechnungRestgliedHöheAbleitung <Topologie>FaktorisierungSummandTermMatrizenringQuadratLinieDivisionTangente <Mathematik>Taylor-ReihePolynomHausdorff-RaumRichtungZahlVariableGradientVektorZahlenbereichE-FunktionVektorrechnungExponentMengePartielle DifferentiationPartielle AbleitungMathematische LogikRichtungsableitungZerlegung <Mathematik>Vervollständigung <Mathematik>Ordnung 1Reelle ZahlLineare FunktionPotenz <Mathematik>StreckeUmkehrung <Mathematik>NeunMatrix <Mathematik>MomentenproblemDifferenzierbarkeitLängeJacobi-VerfahrenAussage <Mathematik>Zusammenhang <Mathematik>MathematikerKettenregelMinimumLokales MinimumMaximumSinusfunktionFunktion <Mathematik>Quelle <Physik>EbeneRauschenKoordinatenSorte <Logik>Diagonale <Geometrie>KerndarstellungInhalt <Mathematik>MultiplikationBindung <Stochastik>ZahlentheorieTotal <Mathematik>EckeFakultät <Mathematik>Graphische DarstellungVorzeichen <Mathematik>SelektorZählenBetrag <Mathematik>Norm <Mathematik>RundungOperatorNullComputeranimation
Transkript: Deutsch(automatisch erzeugt)
präsentiert von Open Learnware, die Plattform für Lernmaterialien an der TU Darmstadt. Ja, guten Morgen dann. Ich heiße Michael Dreher und Sie herzlich willkommen. Also Sie müssen heute mal mich aushalten. Nächste Woche gibt es dann wieder den
normalen Dozenten. Wir hatten bisher das Konzept der partiellen Ableitung gehabt und dann hat man gesagt, es gibt noch ein zweites Konzept, das ist die digitale Differenzierbarkeit und die machen wir heute. Also wir erinnern mal an das erste Semester,
also die Erinnerung. Und zwar nehmen wir uns mal eine Funktion in einem ganz normalen
Koordinatenkreuz und die Funktion, die sieht jetzt mal beispielsweise so aus und da haben wir jetzt hier einen Punkt, den nennen wir jetzt mal x0. Und jetzt wollen wir beispielsweise für ein x, das eben ungefähr hier ist an der Stelle, den Funktionswert jetzt
bestmöglich annähern. Das heißt, wir hätten dann jetzt hier einerseits den Funktionswert f von x0 und dann haben wir hier hinten eben den Punkt x und jetzt passiert folgendes, wir legen jetzt hier die Tangente dran. Die Tangente, das ist jetzt also die bestmögliche
Annäherung. Das heißt, wir nähern jetzt also die Funktion, die jetzt also hier oben ist, auf bestmögliche Weise durch eine gerade Linie an. Und das heißt dann jetzt also für den
Funktionswert f von x, der ist jetzt also hier oben, den können wir also zerlegen in drei Teile. Also einerseits haben wir diesen Anteil hier unten, dann haben wir jetzt hier diesen Anteil, der in diesem Dreieck die Höhe ist und dann jetzt hier dieser Rest. Also wir
können jetzt schreiben, also f von x ist jetzt also gleich f von x0, das ist die Höhe hier unten, plus der Anteil, der jetzt hier die Höhe in diesem Dreieck ist, das
ist eben f' genommen an dieser Stelle x0 hier, mal x minus x0, naja plus eben so ein Schnipselchen hier oben, plus eben der Rest. Und was können wir jetzt über
diesen Rest aussagen? Nehmen wir also diesen Rest, das ist genau dieses oberste Schnipselchen
hier, also das oberste Anteil und jetzt für x nach x0, naja einerseits ist das eben
f von x dividiere durch den Abstand und zwar eben diesen horizontalen Abstand, also x minus x0, x nach x0, dann ist das immer noch 0, das heißt der Bruch, den wir jetzt
hier geschrieben haben, dieser Bruch, der strebt nach 0, das heißt also der Zähler, der muss jetzt schneller nach 0 gehen als der Nenner. Und jetzt, da haben Sie sicherlich schon nachgeschaut, da gibt es so ein Applet im Moodle, Moodle Applet. Also da können
Sie jetzt hier richtig an dem x anfassen und das x hin und her zerren und dann wird eben dieser Bruch schön angezeigt. Gut, und die Idee, die wollen wir jetzt in höhere
Dimensionen verallgemeinern. Also das Problem bei der bisherigen Ableitung ist es ja, wir können ja nicht durch Vektoren dividieren. Und schauen wir mal, was haben wir jetzt hier für eine Division? Wir haben jetzt hier eine Division durch den Abstand
von x und x0. Jetzt kann man sich doch, naja, wenn jetzt hier der Abstand nach 0 geht, das sind ja reelle Zahlen, ist ja kein Problem, da kann ich jetzt hier den Betracht rumsetzen. Also schlimmstenfalls ändere ich das Vorzeichen, mehr passiert ja nicht. Und das ist jetzt ein Punkt, den können wir jetzt verallgemeinern in höhere Dimensionen. Was haben wir jetzt
eigentlich gemacht? Also wir haben die Funktionsgrafen von x angenähert an dieser Stelle hier durch nähert die bestmögliche Gerade und das ist dann eben die Tangente. Und jetzt sagt
man eben, naja, der Rest, der Fehler, den wir jetzt hier machen, dieses Schnipselchen, das soll jetzt mal unwichtig sein. Und das ist dann eben unwichtig in dem Sinne, dass wir eben sagen, dieser Bruch strebt nach Null, wenn das x jetzt also zum x0 wandert. Und insbesondere läuft jetzt also der Zähler schneller nach Null als der Nenner. Okay.
Und das, jetzt versuchen wir das Ganze jetzt mal in die höhere Dimension zu verallgemeinern. Dann kommt das x also aus dem R hoch N, das x0 auch. Dann hätte wir jetzt hier Differenz von zwei Vektoren. Das ist ein Vektor. Davon den Betracht,
naja, Betracht ist eine Zahl. Also die Norm des Vektors ist eine Zahl und durch eine Zahl kann man dividieren. Gut, und das ist dann jetzt also unsere Definition. Also,
Definition. Also, wir haben jetzt also eine Menge, in der jetzt die Variable x eben lebt, die sei offen. Der Punkt, der uns jetzt interessiert, der lebt jetzt also in dieser Menge. Und an
diesem Punkt wollen wir jetzt die Funktion eben durch eine Gerade annähern. Also,
dann heißt jetzt also die Funktion f. Was macht die? Naja, sie bildet ab von der Menge m. Ja, jetzt können wir gleich sagen, machen wir das doch gleich Vektor-wertig. Also, die Funktion f ist jetzt also R hoch M-wertig. Dann heißt die Funktion also total
differenzierbar im Punkt x0. Naja, wenn folgendes gilt. Wir können den Funktionswert f von x in
die drei Summanden zerlegen. Also, wenn, dafür brauche ich jetzt eine Vorbereitung. Ich angebe, wenn es eine Matrix gibt. Und jetzt haben wir also diese Zerlegung f von x. Kann man
jetzt also zerlegen in den konstanten Anteil, der von dem x gar nicht abhängt. Plus jetzt so in den linearen Anteil. Das war die Höhe in dem Dreieck gewesen. Naja, dafür schreiben wir
jetzt A mal x minus x0. Plus jetzt also einen Restsummanden. Und was soll jetzt der Restsummand
machen? Naja, der soll eben nach Null streben, aber eben schneller als x minus x0. Also, wir nehmen es x nach x0 von dem Restsummanden, dividiert durch den Abstand von x minus x0.
Das soll jetzt eben Null sein, beziehungsweise das R ist jetzt Vektor-wertig, also ist das die Null-Vektor. Okay, also jetzt haben wir gesagt, wenn es so eine Matrix A gibt,
dann heißt die Funktion total differenzierbar. Wie wir jetzt die Matrix A finden, das ist eine offene Frage, die beantworten wir gleich. Naja, das A, das was wir jetzt hier stehen haben, das steht doch genau an derselben Stelle, wo vorhin das F Strich von x0 stand. Naja,
übernehmen wir doch die Bezeichnung. Also A heißt totale Ableitung und wir schreiben jetzt,
also das nennt sich jetzt totale Ableitung von F, genommen an der Stelle x0, definieren wir, das ist jetzt eben A. Gut, und jetzt haben wir die Frage, wie finden wir die Matrix A und
welche Eigenschaften hat das jetzt. Also das ist jetzt ein Differenzierbarkeitskonzept, das ist ein bisschen unhandlich, weil wir jetzt im Moment noch nicht wissen, wie wir die Matrix finden. Aber ich werde Ihnen gleich erzählen, wie wir die Matrix finden.
Und es ist aber schön, denn wir haben folgenden Satz, also 2 Neunsten. Wenn x0 total differenzierbar, so ist F in dem Punkt x0 stetig. Und das ist jetzt was wunderschönes.
Also bei den partiellen Ableitungen hat man das ja nicht gehabt. Da gab es ja Funktionen,
die sind partiell differenzierbar und trotzdem unstetig. Und das ist natürlich doof, das will man nicht. Aber bei der totalen Differenzierbarkeit ist das angenehmer. Naja, der Beweis, der geht eigentlich wie in der Analysis 1. Naja, sollte ich dran schreiben,
das ist ein Satz. Gut, wir müssten ja eigentlich nur ausrechnen. Was ist denn dieser Limes? Wenn wir den Limes jetzt ausgerechnet haben und wenn dann F von x0 rauskommt,
dann sind wir glücklich. Also, was wissen wir von der Funktion? Naja, wir wissen, die Funktion ist total differenzierbar. So war es ja vorausgesetzt worden. Also guckt man nach, was heißt das jetzt eigentlich, dass die Funktion total differenzierbar ist?
Naja, da hat man eine Definition gehabt. Die Definition sagt, wir können das F von x in drei Teile zerlegen. Also machen wir das doch mal. Wir zerlegen jetzt also das F von x in drei Teile. Also F von x0 plus a mal x minus x0 plus jetzt hier eben diesen Rest
summanden. Jetzt haben wir das F von x in die drei Teile zerlegt. Naja, jetzt fangen
wir an, rumzurechnen. Also wir würden jetzt also den Limes-Operator ziehen auf jeden einzelnen Summanden. Also Limes auf den ersten Summanden angewendet ist F von x0 plus. Jetzt würden wir den Limes also auf den zweiten Summanden anwenden. Also Limes
von x nach x0 anzuwenden auf a mal x minus x0 plus eben Limes auf den
x nach x0 vom R von x. Naja, und jetzt überlegen wir uns, wir können jetzt hier das Limes am a vorbeiziehen. Also das geht, da haben wir schon damals nicht
bewiesen, das beweisen wir jetzt auch nicht. Also ist das jetzt eben der Nullvektor. Also wenn Sie den Limes-Operator hier vorne jetzt also an dem a vorbeiziehen, steht dann eben a links, der Limes in der Mitte und dann x minus x0, das ergibt beim Grenzwert eben
Null. Und hier hinten können Sie eben sagen F von x0 plus Limes x nach x0. Ich erweitere jetzt mal künstlich F von x, indem ich jetzt mal den Abstand reinsetze, x minus x0. Das ist eine
Zahl mal x minus x0. Norm zu, Betracht zu. Also das, was ich jetzt hier mit den Doppelstrichen zeichne, ist einfach die Länge von dem Verbindungsfeil und jetzt
sehen Sie eben, naja der erste Termin jetzt hier, der strebt nach Null, weil das eben vorausgesetzt war in der totalen Differenzierbarkeit und das strebt auch nach Null. Also ist das ganze eben F von x0 und das ist der ganze Beweis. Also Sie sehen,
wenn Sie sich mal dran gewöhnt haben an diese Beweiserei, ist das gar nicht so schwierig. Also, okay, also jetzt wissen wir, eine Funktion ist total differenzierbar, wenn da so eine
Bedingung gilt und da kommt eine Matrix vor und wir wissen jetzt noch nicht, wie wir die Matrix finden. Aber immerhin, wenn die Funktion total differenzierbar ist, dann ist es stetig.
Und jetzt kommt die Frage, wie finden wir die Matrix? Das ist eigentlich ganz einfach. Das ist in der nächsten Nummer. Also da geht es jetzt um den Zusammenhang von partieller und totaler
Ableitung. Also noch mal ganz kurz zur Arbeitsstrategie. Die partiellen Ableitung
hatten wir uns das erste Mal angeschaut. Die kann man recht einfach ausrechnen. Da ist die Theorie aber ein bisschen doof. Ja, jetzt schauen wir uns die totalen Ableitung an. Da ist die Theorie schön. Und jetzt kommt eben, wie hängen die beiden zusammen? Also, wir haben
jetzt also wieder so eine Menge, wo das X drin lebt. Also R hoch. Dort ist ein Punkt drin.
Und wir haben wieder so eine Funktion, die bildet ab von M in den R hoch. M. Und jetzt
haben wir also zwei Aussagen. Wenn die Funktion total differenzierbar ist, dann ist sie partiell differenzierbar. Ist F in X0 total differenzierbar, dann ist sie zum einen partiell differenzierbar
und sogar existieren sämtliche Richtungsableitungen. Also erinnern wir uns noch mal, was bedeutet
jetzt Richtungsableitung? Naja, wir haben jetzt hier unten diese Menge M. Da picken wir uns jetzt also eine Richtung raus. Und jetzt laufen wir in diese Richtung. Dann hängt die Funktion ja eigentlich nur noch von dieser einen einzigen Variablen ab. Und das Verhalten
in der Funktion in diese Richtung wird dann beschrieben von der Richtungsableitung. Gut, was heißt das jetzt also in Formeln? Also wir nehmen uns jetzt so eine Richtung her. Die
soll jetzt mal nicht der Nullvektor sein, sonst ist es ja sinnlos. Dann gilt folgendes. Also erstens, die Richtungsableitung gibt es und zweitens, die kann man richtig schön
hinschreiben. Also die Richtungsableitung in Richtung V von F, genommen an der Stelle X0, das ist jetzt eben nichts anderes als eben die Matrix, die wir in der totalen Ableitung hat, mal den Richtungsvektor V. Und jetzt schauen wir uns das mal an. Also
hier vorne steht jetzt, also hier steht jetzt diese mysteriöse Matrix, die in der totalen
Ableitung vorkommt. Hier steht jetzt der Richtungsvektor als Spaltenvektor. Und wenn Sie sich das mal genauer anschauen, dann merken Sie, die Dimensionen, die passen ganz genau zusammen und das ist alles kompatibel. Gut, und jetzt können wir uns ja sagen, ok, dann nehmen wir doch für die Richtungsableitung eben die Koordinatenrichtung. Insbesondere
also, jetzt nehmen wir also für die Richtungsvektoren den J-Koordinatenvektor. Und was bekommen
wir dann? Also dann hatten wir hier vorne DF abgeleitet in die Richtung XJ, genommen
am Punkt X0. Das ist jetzt also gleich die Matrix, die in der totalen Ableitung vorkommt, mal jetzt hier den J-Einheitsvektor. Naja, und wenn Sie jetzt so eine Matrix multiplizieren
mit dem J-Einheitsvektor, dann ist das doch genau die Jte Spalte von DF. Das
ist jetzt genial. Denn auf diesen Wege bekommen Sie jetzt die Möglichkeit, wie Sie die Spalten von der Matrix in der totalen Ableitung ausrechnen können. Sie nehmen einfach die Ableitung von dem F in Richtung XJ. Aber DF nach DXJ, genommen an der Stelle X0, das kennen
wir ja schon, das ist eben die Jte Spalte in der Jacobi Matrix. Sie nehmen einfach
die partiellen Ableitungen und dann stellen Sie die eben so in einem geeigneten Schema nebeneinander und übereinander. Und das, was dann rauskommt, das nennt man Jacobi
Matrix. Also, wenn F jetzt total differenzierbar ist, dann gilt eben Folgendes. Die Matrix,
die in der totalen Ableitung vorkommt, ist nichts anderes als eben die Jacobi Matrix zu genau der gleichen Funktion. Ist also eigentlich nichts Besonderes. Also Sie müssen
jetzt nicht zwei verschiedene Matrizen lernen, sondern das ist dieselbe Matrix, die zweimal verschiedene Namen bekommen hat. Das heißt, wenn die Funktion total differenzierbar ist,
dann ist sie partiell differenzierbar. Und jetzt kommt die traurige Nachricht, die Umkehrung gilt nicht. Wenn F partiell differenzierbar ist, dann könnte sie total differenzierbar
sein, muss sie aber nicht. Das ist ein Beispiel, das kennen Sie eigentlich schon. Wir hatten das letzte Mal oder in einer der letzten Stunden so ein Beispiel gehabt
von einer Funktion, die ist partiell differenzierbar, aber nicht stetig. Also, wenn diese Aussage, wenn diese Equivalenz im Folgerungsfall jetzt hier war, wäre und die Funktion partiell differenzierbar wäre, dann wäre sie total differenzierbar, dann wäre
sie stetig, nach dem Satz, den wir vorhin bewiesen hatten. Aber das kann ja nicht sein, denn wir hatten das letzte Mal ein Beispiel für eine Funktion, die partiell differenzierbar ist, aber unstetig. Gut, also das aber nur so als Nebenbei-Bemerkung.
Das Ganze können wir jetzt noch ein bisschen retten, wenn wir sagen, aber wenn F jetzt
stetig partiell differenzierbar ist, das bedeutet, dass die Ableitungen stetig sind,
dann ist die Welt wieder in Ordnung. Dann F total differenzierbar. Gut, nehmen wir jetzt einfach so hin und akzeptieren das. Jetzt wollte ich Ihnen noch
sagen, wie man jetzt also praktisch die Matrix zur totalen Ableitung bestimmt, also die
Matrix, die in der totalen Ableitung vorkommt, das ist dieses D, F und X0. Und wie finden wir das jetzt? Der erste Schritt ist, Sie bestimmen alle partiellen Ableitungen.
Alle partiellen Ableitungen, also D, F, K nach D, X, J. Gut, dann sortieren Sie die zum
J zusammen, sortiere diese zur Jacobi-Matrix, J, F von X0 zusammen. Und schließlich prüfen
Sie nach, ob sie stetig sind. Also D, F, K nach D, X, J stetig und normalerweise sind
die alle stetig. Und wenn das eben gilt, dass diese Ableitungen alle stetig sind, was eben normalerweise der Fall ist, also wenn das eben der Fall ist, dann ist
eben die totale Ableitungsmatrix gleich der Jacobi-Matrix. Gut, und dann überlegen
wir uns nochmal die verschiedenen Glattheitseigenschaften. Glattheitseigenschaften von einer Funktion,
zum Beispiel stetig partiell differenzierbar sein. Wenn das ist, dann ist auch die Funktion
total differenzierbar. Und die Umkehrung gilt aber nicht. Und vorhin hat man gezeigt,
wenn die Funktion total differenzierbar ist, dann ist auch stetig. Dann gilt natürlich die Eigenschaft, wenn sie total differenzierbar ist, dann existieren alle Richtungsableitungen.
Wenn jetzt alle Richtungsableitungen existieren, dann heißt das doch, also in jeder Richtung, die wir jetzt hier unten haben, haben wir also so ein Steigungsverhalten, also insbesondere
eben für die Koordinatenrichtung. Denn die partiellen Ableitungen, das sind ja nur spezielle Richtungsableitungen. Naja, und der Pfeil ist natürlich auch klar. Also
wenn die, also hier oben steht ja letztlich, wenn die partiellen Ableitungen existieren und stetig sind, naja, dann existieren die partiellen Ableitungen. Also der Pfeil ist billig. Gut, das wären jetzt also fünf verschiedene Glattheitseigenschaften,
die eine Funktion haben kann und diese Glattheitseigenschaften stehen in diesen logischen Beziehungen zueinander und man kann jetzt keinen einzigen Pfeil rumdrehen. Also alle Umkehrungen sind gut. Dann machen wir noch eine Bemerkung zum Ende dieses
Abschnitts. Und zwar gibt es, jetzt gibt es wieder das übliche Problem, die Schreibweisen sind extrem unterschiedlich, da müssen sie leider als Student oder Studentin einfach
durch und das müssen sie aushalten, dafür kann ich nichts. Also eine totale Ableitung, eine totale Ableitung nach einer Variablen, zum Beispiel T, kommt eine spezielle Bezeichnung
und zwar mit solchen aufrechten Ds geschrieben. Das heißt, sie müssen dann teilweise
aufpassen. Es kann passieren, dass sie jetzt in einer Formelzeile einerseits
das hier stehen haben, das ist die partielle Ableitung nach T oder es kann in derselben
Formel eben das hier vorkommen, das ist dann eben die totale Ableitung nach T. Also
nehmen wir mal ein Beispiel, also F von T und jetzt sagen wir mal G von T. Und
das Ganze bilden wir jetzt in, jetzt wollen wir die gesamte Ableitung bilden. Sehen
Sie folgendes, das T gibt es hier vorne im ersten Argument direkt und da hinten gibt es das T eben indirekt, also in dem G drinne und jetzt schreibt man das eben wie folgt, naja ich leite das einerseits nach dem vorderen Argument hier ab, also das schreibt man dann eben logischerweise so und das ist jetzt, damit meint man
jetzt die Ableitung von dem F nach dem ersten Argument T hier vorne und dann geht es eben nach Kettenregel weiter, die partielle Ableitung von F nach dem G mal
G Strich von T und jetzt sehen Sie folgendes, also hier vorne steht jetzt also die partielle Ableitung im runden D und hier vorne die totale Ableitung im aufrechten D.
Also das können Sie eben lesen als, Sie können ja wenn Sie ja wollen das F jetzt nach rechts unten schreiben und dann haben Sie also links die totale Ableitung und rechts die partielle. Und die partielle Ableitung ist jetzt eben eine teilweise Ableitung, weil
eben Sie so tun, als ob das zweite Argument hier hinten, also das jetzt hier sich nicht ändert und nur dieses T hier vorne wird variiert und dieser, so manch jetzt hier, der misst einfach wie ändert sich das F, wenn wir nur das T hier vorne laufen lassen und das G hier hinten bleibt fest. Gut, nehmen wir noch ein zweites Beispiel, also
F von xy ist jetzt x hoch 3y plus x mal e hoch y und jetzt für das x setzen wir
jetzt mal t² ein, für das yt hoch 3, dann hatte die Funktion bloß noch eine einzige Variable, die ist jetzt t und nach der wollen wir jetzt ableiten. Naja, also
schreiben wir uns das mal hin, was das jetzt heißt, also d nach dt. Ich setze das jetzt
einfach mal ein, dann hätten wir jetzt hier also t² hoch 3 mal t hoch 3 plus t² mal e hoch t hoch 3 und ich habe jetzt hier an der Stelle in diesem Exponenten
so eine Klammer gemacht, die ist eigentlich überflüssig, also in der Mathematik ist es so üblich, wenn der Exponent so was zusammengesetzt ist, dann rechnet man den zuerst aus. Also ist das jetzt eben die Ableitung nach t, von da vorne steht jetzt also t hoch 9 plus t
e hoch t hoch 3 und das kann man jetzt ausrechnen, das ist 9t hoch 8 plus hier hinten nach Produktregel, also 2t e hoch t hoch 3 plus t². Jetzt wird die e-Funktion abgeleitet, da bleibt
die e-Funktion am Leben und dann wird innen drin abgeleitet, mal 3t². Damit das Ganze jetzt
noch ein bisschen schöner aussieht, fassen wir das zusammen, 9t hoch 8 plus e hoch t hoch 3 mal 2t plus 3t hoch 4. Gut, also jetzt können wir differenzieren, partiell und total und wir
können auch in bestimmte Richtungen differenzieren und das ganze wollen wir jetzt anwenden. Also im zweiten Kapitel kommt jetzt der dritte Abschnitt Anwendungen. Also ein wesentliches Ziel besteht
darin, wir wollen komplizierte Funktionen annähern durch einfache Funktionen. Also einfache Funktionen sind zum Beispiel lineare Funktionen oder quadratische oder Polynome. Das führt uns dann auf den Taylorischen Satz und den wollen wir uns jetzt also anschauen. Satz von Taylor
in mehreren Variablen. Gut, gehen wir mal zurück ins erste Semester, wie ist da damals die
Situation in einer Dimension aus. Wir hatten also eine Funktion, wo wir eine reelle Zahl
reinstecken und es kommt eine reelle Zahl raus und dann machen wir diese Zählerentwicklung um eine Stelle x0 aus den reellen Zahlen und dann galt folgendes. Na ja, wir können jetzt also das
f einerseits in dieses Taylorpolynomen zerlegen, also tk von x plus jetzt also in gewissen Restzumanden. Und an der Stelle jetzt schamlose Werbung. Im Moodle gibt es dazu ein Applet.
Da können Sie das erstmal für eine Sinusfunktion einfach mal ausprobieren. Und jetzt müsste ich
natürlich verraten was jetzt dieses Taylorpolynom ist. Also das Taylorpolynom tk von x hat jetzt also den Grad k. Also es hat jetzt also Summanden von der Ordnung 0 bis k. Und wie
baut man jetzt die Summanden zusammen? Also Sie entwickeln jetzt natürlich um den Punkt x0. Also Sie nehmen jetzt die j der Ableitung an der Stelle x0. Das dividieren Sie durch
j Fakultät. Und dann kommt eben dieser Summand x minus x0 hoch j. Das ist jetzt also das Taylorpolynom. Und jetzt möchte man folgendes haben. Na ja, man sagt sich ja dieses Polynom
ist ja noch vergleichsweise einfach zu verstehen. Und wir möchten jetzt, dass dieses Polynom eben eine Annäherung ist für das F. Und das ist dann eine gute Annäherung, wenn eben der
Restzumand, der jetzt hier hinten ist, einigermaßen klein ist. Und das tun wir jetzt an dem Restzumand. Man weiß nicht wie er genau aussieht, aber man weiß wie der Summand so ungefähr aussieht. Und wir hätten jetzt also das Restglied genommen an der Stelle k. Na ja, wie sieht
das Ding jetzt aus? Dieser Restzumand, der sieht so ähnlich aus wie der letzte Summand, den wir mitgenommen haben. Wir schalten also überall eins weiter. Also Bruchstrich. Unten
kommt dann die Fakultät. Also k plus eins Fakultät. Oben nehmen wir jetzt also die k plus erste Ableitung. Und jetzt kommt der einzige Unterschied. Na ja, diese k plus erste Ableitung, die rechnen wir jetzt nicht aus an der Stelle x0, sondern eben an irgend so einer Zwischenstelle.
Und dann x minus x0 hoch k plus eins. Das ist jetzt also das Restglied. Und das
x, das ist jetzt also so eine Zwischenstelle. Wir wissen, dass es sie gibt, aber im Prinzip wissen wir mehr nicht. Und x ist zwischen x und x0. Also das hatten wir im ersten
Semester gehabt und das wollen wir jetzt auf höhere Dimensionen verallgemeinern.
Okay, wir fangen mal ganz langsam an. Also Satz von Taylor. Und hier betrachtet man ein ganz einfaches Polynomen. Und zwar das einfachste Taylor Polynomen, was man sich
denken kann, das ist doch genau das, was zu der Tangente gehört. Also sie haben da die Funktion, die nähern sie an durch die Tangente. Und das ist so ziemlich das schönste, was man sich vorstellen kann. Und das machen wir jetzt. Also wir nehmen
jetzt also ein Taylor Polynomen vom Grad eins. Also was brauchen wir jetzt? Wir brauchen erst einmal eine Funktion. Die bildet jetzt ab von, was weiß ich, M in den R hoch
eins. Das M lebt jetzt also irgendwie im R hoch N. Und die Funktion, die soll jetzt mal zwei Ableitungen haben. F sei zweimal stetig differenzierbar. Das heißt, sie
können jetzt also die erste Ableitung bilden, die heißt Gradient. Sie können die zweite Ableitung bilden, die heißt Hessematrix. Und die sollten alle schön
stetig sein. Das ist meistens eben erfüllt. Und wir hätten jetzt also wieder diesen Entwicklungspunkt, wo wir eben entwickeln wollen. X0 sei jetzt also in M. Gut,
also jetzt malen wir uns das Ganze vielleicht mal doch ein bisschen hin. Also das jetzt hier ist unsere Kartoffelmenge M. Und jetzt hätten wir hier also das X0. Und hier
binden jetzt das X. Okay, und dann zeichnen wir jetzt hier mal die Verbindungsstrecke ein. Und jetzt gilt Folgendes. Sei jetzt also das X auch in M. Und die Verbindungsstrecke
von X0 nach X sei auch in M. Ja, wozu brauche ich die Verbindungsstrecke? Naja,
es kommt ja irgendwo jetzt dieser Punkt Xi vor. Der muss ja irgendwo sein. Und ich verkaufe Ihnen jetzt der Punkt Xi, der liegt auf der Strecke. Dann ist, naja,
also das F von X kann ich jetzt also annähern durch das Taylor-Pollinom. Das Taylor-Pollinom hat einen Summanden der Ordnung 0. Es hat jetzt einen weiteren Summanden der
Ordnung 1. Das ist folgende. Also ich nehme jetzt den Gradienten an der Stelle von X0. Das ist jetzt ein Zeilenvektor. Den multipliziere ich jetzt mit X minus X0. Also X minus
X0 ist ein Spaltenvektor. Wenn ich jetzt diesen Zeilenvektor von hier mit dem Spaltenvektor multipliziere, kommt eine Zahl raus und das soll auch so sein. Dann ist das jetzt hier also das Taylor-Pollinom plus jetzt also einen Summanden den nenne ich jetzt R1 von X. Das
ist jetzt also das Restlied. Und für dieses Restlied haben wir eine richtig schöne Formel. Naja, das muss ich jetzt hinschreiben. Also R1 von X, also folgendes. Wir nehmen
jetzt hier so ein Faktor in halb, dann jetzt hier X minus X0, was jetzt eigentlich eine Spalte ist. Wir transponieren das und dann wird es eine Zeile. Dann multiplizieren wir
die Hessische Matrix an der Zwischenstelle und dann mal X minus X0 und das Xi ist irgendwo auf der Verbindungsstrecke. Wir können uns jetzt das Xi nicht aussuchen. Wir können
jetzt nicht sagen, ich möchte das Xi oder ich möchte das. Wir wissen nur, das gibt es
irgendwo. Es liegt irgendwo auf der Verbindungsstrecke und wenn wir dieses Xi jetzt hier also in und dann von links mit diesem Zeilenvektor multiplizieren und von rechts mit diesem Spaltenvektor multiplizieren, kommt ihm genau das Restlied raus. Und hier vorne ist
also ein Zeilenvektor, hier ist diese quadratische Hessische Matrix, hier ist der Spaltenvektor, das ergibt eine Zahl. Also wie kann man jetzt die Verbindungsstrecke beschreiben
mathematisch? Das machen sie mit den üblichen Methoden, die sie aus der Vektorechnung
kennen. Also Verbindungsstrecke, die heißt jetzt einfach mal S, damit sie einen Namen hat. Also sie fangen an mit dem Punkt X0 plus jetzt also lambda mal den Verbindungsvektor
und das lambda ist jetzt also eine Zahl. Der Richtungsvektor ist also ein Vektor
und jetzt wollen sie von dem X0 laufen bis zum X, das heißt 0 kleiner gleich lambda kleiner gleich 1. Wenn sie jetzt lambda gleich 0 setzen, dann sind sie im Punkt X0. Wenn sie lambda gleich 1 setzen, dann sind sie im Punkt X. Irgendwo in dieser Strecke S ist
jetzt also das Xi. Wir können uns das Xi nicht aussuchen, aber irgendwo da muss es sein.
Also ich habe ihnen jetzt das Taylor-Polynomen Erste Ordnung hingeschrieben, da kommt ihm der Gradient drin vor und jetzt schreibe ich ihnen noch das Taylor-Polynomen Zweite Ordnung hin und dann, weil wir das später noch mal brauchen werden. Also das sieht
eigentlich ganz genauso aus wie das Rest liegt, bloß jetzt nehmen wir nicht das Xi, sondern das X0. Also Taylor-Polynomen Zweite Ordnung ist. Wir nehmen jetzt also den konstanten Summanden, f von X0. Dann nehmen wir uns den linearen Summanden, den hatten
wir vorhin schon gehabt. Also Gradient von f genommen an der Stelle X0 mal x minus x0. Das ist jetzt der lineare Summand plus, ja jetzt schreiben wir so etwas ähnliches
hin wie das Rest liegt, aber an der Stelle Xi setzen wir jetzt eben X0 ein. Also ein halb mal Zeilenvektor. Also damit das jetzt ein Zeilenvektor wird, setze ich hier die Transponierung dran, mal jetzt eben die Hessematrix von f genommen an der Stelle
X0, mal jetzt hier eben noch ein Faktor x minus x0. Gut und das dazugehörige Rest
liegt, das wäre dann also irgendwas Kubisches und das sieht aber so schrecklich aus, das schreiben wir uns jetzt nicht hin. Und jetzt wollen wir uns mal überlegen, kann man das Ganze ein bisschen schöner schreiben oder so, dass man auch ein bisschen was versteht, was da eigentlich los ist. Also die einfachste nicht banale Situation wäre
eben was zweidimensionales. Also für zwei Variablen, das heißt der Vektor x soll
jetzt eben so ein Vektor mit zwei Einträgen sein. Das Vektor x0 soll jetzt eben sein
x0, y0 und jetzt setzen wir das einfach mal ein und rechnen das mal aus und dann
werden wir ja sehen, wie wir das interpretieren. Okay, also wir hätten jetzt also einerseits f von x0, y0. Das ist der Summand hier vorne. Dann, okay jetzt steht hier Gradient.
Was ist der Gradient? Naja der Gradient ist ein Zeilenvektor. Da schreiben sie die
beiden Ableitungen einfach schön hin. Also Zeilenvektor df nach dx. Einsetzen müssen wir jetzt den Punkt x0, y0. Das ist jetzt der erste Eintrag von dem Gradienten hier. Dann haben wir den zweiten Eintrag df nach dy genommen an der Stelle x0, y0.
Jetzt machen wir den Gradienten zu und jetzt steht hier eben der Verbindungsvektor von x und x0. Das ist dann jetzt also ein Spaltenvektor. Also x minus x0, y minus
y0. Okay und das ganze ist jetzt hier also zu lesen als so ein Produkt von Zeilenvektor
mal Spaltenvektor im Sinne von Matrix Matrix. Okay und dann kommt jetzt die Hesse Matrix, also der quadratische Summand. Also da hat man hier vorne ein halb. Dann jetzt hier der Verbindungsvektor als Zeile geschrieben. x minus x0. Ich mache da jetzt mal ein Komma hin,
y minus y0. Dann kam die Hesse Matrix. Die hat jetzt also zwei Ableitungen. Also del 2f nach del x². Also solche runden Ds nennt man gerne del. Genommen an der Stelle x0, y0.
Dann hat man jetzt hier die gemischte Ableitung. Genommen an der Stelle x0, y0. Hier jetzt
ebenfalls diese Ableitung und jetzt hier rechts unten die zweite Ableitung nach y. Also hier in diese Nebendiagonalen haben sie jetzt die
gemischten Ableitung, aber die rechts oben und links unten sind ja gleich nach dem Satz von Schwarz, also die Matrix ist symmetrisch. Okay, und dann fehlte noch hier rechts der Verbindungsvektor als Spalte.
Und das müssen wir jetzt einfach mal ausrechnen und dann sehen wir was rauskommt. Also wir hätten jetzt, wir fangen da vorne an, f von x 0 y 0 plus
jetzt ersten Eintrag mal ersten Eintrag, also del f nach del x genommen an der Stelle x 0 y 0 mal x minus x 0 plus jetzt den anderen Eintrag, also zweiter mal zweiter.
Okay, dann jetzt kommen wir zur zweiten Zeile, also ein halb x minus x 0 y
minus y 0. Ich rechne jetzt mal als erstes das Produkt von der Matrix mit der Spalte aus. Och nö,
ja ich muss jetzt mit dem Platz quetschen. Also f x x genommen an der Stelle x 0 y 0 mal x minus x 0 plus f x y genommen an der Stelle x 0 y 0
mal y minus y 0. Also deswegen, genau für solche Platzgründe hat man eben diese andere Schreibweise erfunden. f y x genommen an der Stelle x 0 y 0 jetzt mal den hier oben mal
x minus x 0 plus also f y y x 0 y 0 mal y minus y 0. Das ist jetzt also ein Spaltenvektor und jetzt müssen wir bloß noch
diesen Zeilenvektor von hier mit dem von dort zu multiplizieren und dann jetzt ein bisschen das schön zusammen puzzeln. Also okay also f von x 0 y 0 plus d f nach d x von x 0 y 0 mal
x minus x 0 d f nach d y okay und jetzt fangen wir mal an also wir hätten jetzt zum Beispiel den ersten Eintrag von hier mit den
ersten von hier und da gehen wir mal schrittweise vor also ein halb f x x von x 0 y 0 und da haben wir ja das x minus x 0 von hier und da auch noch mal also quadratisch.
Okay dann hätten wir jetzt diesen x minus x 0 Term von hier vorne mit dem gemischten Faktor ja und außerdem haben wir den ja entsprechend nochmal also jetzt den zweiten jetzt mit dem ersten von hier also die haben wir zweimal.
Also f x y genommen an der Stelle x 0 y 0 mal x minus x 0 mal y minus y 0. Also an der Stelle benutzen sie jetzt dass die gemischten Ableitungen von hier und von hier eben gleich sind. Das ist der Satz von Schwarz.
Und dann haben sie noch den Summanden wo sie jetzt das y minus y 0 multiplizieren mit dem dort. Da kommt jetzt hier wieder das in halb f y y genommen an der Stelle x 0 y 0 mal y minus y 0
zum Quadrat. Sie werden mir jetzt sicherlich zugeben dass sie das Restglied was dazugehört also mit dritten Potenzen nicht sehen wollen. Also das sieht noch schlimmer aus. Aber da gibt es eine Logik dahinter.
Und zwar wie könnte man das jetzt noch schreiben? Man könnte ja sagen die Funktion selber ist gleich der Nullten Ableitung. Also ich schreibe jetzt mal f von x 0 Vektor Nullfakultät.
Das sieht erst mal ein bisschen dämlich aus. Aber da steckt eine Logik dahinter. x minus x Null hoch Null mal y minus y Null hoch Null. Das ist jetzt eine ziemlich seltsame Schreibweise für den ersten Summanden.
Also irgendwas hoch Null ist eins. Nullfakultät ist eins. Also was jetzt hier steht und da bis da ist eine ziemlich seltsame Schreibweise für den hier. Okay. Naja jetzt verarztet man mal den jetzt hier. Und was ist da jetzt passiert?
Also wir haben eine Ableitung und ein Faktor x. Und jetzt hier die Ableitung wirkt auf in x Richtung und die Differenz ist in x Richtung. Dann schreiben wir das doch mal vielleicht so. Also Ableitung
in x Richtung genommen an der Stelle x Null. Ich schreibe da jetzt mal so eine künstliche Einsfakultät Nullfakultät mal x minus x Null hoch eins mal y minus y Null hoch Null. Und jetzt sehen Sie, hier vorne steht eine Einsfakultät.
Die korrespondiert zu dem Exponenten eins. Hier unten haben Sie eine Nullfakultät. Die korrespondiert zu der Null hier oben. Und hier haben Sie also eine Ableitung nach x und keine einzige Ableitung nach y. Okay jetzt der nächste Summand. Df nach
dy genommen an der Stelle x Null Vektor. Da ist jetzt also das y relevant. Also wir haben keine einzige Ableitung nach x. Aber eine nach y. Ein x Faktor gibt es nicht. Aber einen einzigen y Faktor.
Also das sieht jetzt ein bisschen übermäßig kompliziert aus. Da fragt man sich, was soll das? Aber jetzt beim quadratischen Termin wird das dann richtig interessant. Da hätten wir ja den Termin, wo jetzt zwei Ableitungen auf das x gehen.
d2f nach dx Quadrat genommen an der Stelle x Null Vektor. Und da schreibe ich jetzt hier eine Zweifakultät hin und eine Nullfakultät x minus x Null Quadrat y minus y Null hoch Null.
Und genau den Summanden hatten wir vorhin gehabt. Also die Zweifakultät, das ist innerhalb, ist eben die 2 im Nenner. Okay und dann hatten wir den Termin mit den gemischten Ableitungen. Also die zweite Ableitung von f nach x nach y genommen an der Stelle x Null.
Da schreibe ich jetzt hier eine Ableitung nach x, also 1 Fakultät. Eine Ableitung nach y, also nochmal 1 Fakultät. Das ist eine umständliche Schreibweise für 1. x minus x Null hoch 1 mal y minus y Null hoch 1.
Okay und dann hatten wir noch den letzten Summanden und dann haben wir es endlich geschafft. d2f nach dy Quadrat x Null Vektor. Also keine Ableitung nach x. 2 Ableitungen nach y. Ein x Faktor gibt es nicht.
Und den y Faktor gibt es 2 mal. Und das können Sie sich dann anschauen und das passt genau zusammen. Und der Witz ist jetzt, das ist jetzt eine Schreibweise, die können Sie problemlos auf höhere Ableitungsordnungen verallgemeinern.
Also für höhergradige Taylor Polynome.
Gut, dann damit Sie jetzt hier nicht so theoretisch nach Hause gehen, gucken wir uns ein Beispiel an.
Also wir nehmen jetzt mal F von xy wäre jetzt also 1 plus 3
y Quadrat e hoch x. Und der Punkt, um den wir jetzt entwickeln, ist mal der Nullpunkt.
Jo und dann fangen wir mal an mit allen Ableitungen also. Also wenn ich das jetzt nach x ableite, dann habe ich nur das e hoch x hier hinten zu differenzieren.
Die e Funktion reproduziert sich. Also ist jetzt also 1 plus 3 y Quadrat mal e hoch x. Und da müsste ich jetzt natürlich den Entwicklungspunkt einsetzen, also f x von
0 0, setzen wir jetzt also mal für y gleich 0, 1 für x gleich 0, dann kommt 1 raus. Entsprechend jetzt die Ableitung nach y. Also das y haben wir jetzt nur hier vorne, das ergibt also
ein 6y und f y von 0 0, das ist dann eben 0. Ok, jetzt
zweite Ableitung nach x. Da gucken wir jetzt also hier hin, das ist die erste Ableitung, die müssen wir jetzt noch mal ableiten, dann steht da also 1 plus 3 y Quadrat e hoch x. In den Entwicklungspunkt eingesetzt ergibt dann also
1. Die gemischte Ableitung, da schauen wir jetzt also beispielsweise auf den jetzt hier, 6y e hoch x, leiten das nach x ab, dann ist das also 6y e hoch x.
Und da jetzt in den Entwicklungspunkt eingesetzt ergibt 0. Und dann hat man noch die zweite Ableitung nach y. Da schauen sie also hier hin, leiten das nach y ab und dann kommt also 6
e hoch x raus. f y y jetzt Entwicklungspunkt eingesetzt ergibt 6. Ok. Ja, und dann ermitteln sie das Teller-Podinom zweiten Grades.
Also Teller-Podinom T2 von xy, das ist jetzt also gleich, sie haben den Termen Nullte Ordnung, also
f von 0 0 plus also sie nehmen jetzt hier also den Term erstte Ordnung, das ist jetzt also 1 mal x. Nehmen sie den jetzt hier plus 0 mal y plus
eineinhalb mal, also die zweite Ableitung nach x 1 mal x² plus jetzt also 1 mal 0 mal xy, das ist der jetzt hier plus
eineinhalb mal 6 mal y². Das war jetzt vielleicht ein bisschen schnell.
also was jetzt hier steht, das ist jetzt einfach f x genommen an der Stelle 0 0 mal x plus f y genommen an der Stelle 0 0 mal y plus jetzt hier eineinhalb. Dann haben sie jetzt hier die zweite Ableitung nach x an der Stelle 0 0 mal x².
Plus jetzt hier also einmal die gemischten Ableitung f xy von x genommen an der Stelle 0 0 mal xy, also an der Stelle geht das in
halb weg, weil sie ja zwei gemischte Ableitungen haben, einmal nach xy einmal nach yx, aber die sind gleich, weil der Satz von Schwarz das so macht. Plus jetzt hier eineinhalb mal f yy von 0 0 genommen an der Stelle y².
Und wenn wir das jetzt alles zusammen puzzeln, kommen wir auf also f von 0 0 ist 1 plus x und dann kommt hier 0 plus also eineinhalb
x² plus 3 y². Gut, das ist jetzt das Taylor-Pollinom vom Grad 2 für diese Funktion. Sie hätten auch noch einen zweiten Rechenweg nehmen können, in welchen sie nehmen ist dann in der Klausur im Prinzip egal, Hauptsache sie können
begründen, was sie tun. Alternativer Weg, wir
Erinnerung an die Vorlesung vom ersten Semester und zwar das ist dann das, wie Sie es wenn es sich anbietet, in einem Beruf dann sowieso machen werden. Schreiben wir uns das mal hin, was wir eigentlich haben, also 1 plus 3
y² mal e hoch x und e hoch x, das ist jetzt eine Funktion, die hat nur eine einzige Variable und da können Sie ja sagen, ich habe im ersten Semester gut aufgepasst, ich weiß was das ist, 1 plus 3 y² mal
jetzt steht eben hier also 1 plus x plus x² durch 2 Fakultät plus x hoch 3 durch 3 Fakultät plus x hoch 4 durch 4 Fakultät plus usw.
Also die e-Funktion ist eben so ziemlich die wichtigste Funktion, die Sie gebrauchen werden und dann können Sie jetzt sagen, ich multipliziere jetzt fröhlich aus, also jeden Summanden hier von links, multipliziere ich mit jedem Summanden von rechts
und ich brauche ja bloß die Terme bis zum quadratischen Glied, alles was dahinter kommt ist mir sowieso egal. Also multiplizieren wir mal die 1 mit der 1, dann haben wir jetzt hier die 1 mit dem x plus x plus 1 mal x² halbe plus
1 mal x² halbe, dann steht jetzt hier 1 mal x hoch 3 und den Termin will ich gar nicht haben, ich will ja sowieso bis zum Quadrat alles nur haben. Ok, also kann ich an der Stelle jetzt sagen, das stopfe ich in die Bündchen rein und dann habe ich jetzt hier 3, habe ich den ersten Summanden hier vorne abgearbeitet,
dann bleibt bloß noch dieses 3y² also 3y² mal 1 plus 3y² mal 1 und dann steht jetzt hier schon 3y² mal x, ne, das sind aber 3 Faktoren.
Ja, die stopfe ich wieder in die Bündchen rein, also plus Punkt Punkt Punkt und das ist genau das, was wir vorhin eben auch gehabt hatten, also 1 plus x plus x² halbe plus 3y² plus
das Restglied. Jo, also Sie hätten da jetzt also einen zweiten Weg, wie Sie eben das Telepolynom ermitteln können, das hat jetzt für Sie den Vorteil, wenn Sie
gefragt werden in der Hausaufgabe, ermitteln Sie das Telepolynom, versuchen Sie es doch auf zwei verschiedenen Wegen, dann können Sie eben eine Probe machen auf diesen Wege und schauen, ob Sie sich jetzt ob Sie richtig gerechnet haben.
Also noch mal zur Vervollständigung. Die haben jetzt hier vorne alle Summanden vom Grad höchstens 2 genommen und der Restterm, der hat dann alle weiteren Summanden.
Mit dem Telepolynom würde ich jetzt an der Stelle aufhören wollen und was wir jetzt als nächstes uns anschauen werden, naja, kann man jetzt das Telepolynom benutzen, um jetzt rauszufinden, wo liegen denn bei so einer Funktion Maxima und Minima. Also
Sie wissen, so eine Funktion wenn so eine Funktion ein Minimum hat, dann wissen Sie aus der Schule, dass da die erste Ableitung Null ist und die zweite Ableitung sollte wenn möglich positiv sein. Wenn Sie so ein Maximum haben, dann sollte eben die erste Ableitung Null sein.
Und die zweite idealerweise negativ. Und das wäre jetzt aber ein neuer Abschnitt und den haben Sie dann morgen. Gut, ich bedanke mich.