We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback
00:00

Formale Metadaten

Titel
Satz 6.4
Serientitel
Teil
19
Anzahl der Teile
28
Autor
Lizenz
CC-Namensnennung - keine kommerzielle Nutzung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen und nicht-kommerziellen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen und das Werk bzw. diesen Inhalt auch in veränderter Form nur unter den Bedingungen dieser Lizenz weitergeben.
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache

Inhaltliche Metadaten

Fachgebiet
Genre
Abstract
Aufgabe der Statistik ist es, Rückschlüsse aus Beobachtungen zu ziehen, die unter dem Einfluss des Zufalls enstanden sind. Diese Vorlesung gibt eine umfassende Einführung in die zugehörige mathematische Theorie. Behandelt werden u.a.: Hauptsatz der Mathematischen Statistik, Dichteschätzung, nichtparametrische Regressionsschätzung, Punktschätzverfahren, statistische Tests, Bereichsschätzverfahren.
RechnenSignifikanztestSpieltheorieStatistikIntegration <Mathematik>NormalverteilungVarianzWahrscheinlichkeitstheorieWahrscheinlichkeitsverteilungQuadratZufallsvariableVariableZusammenhang <Mathematik>FreiheitsgradVerteilungsfunktionSummeRuhmasseVerträglichkeit <Mathematik>Physikalische GrößeArithmetisches MittelParametersystemt-VerteilungDichte <Physik>Chi-Quadrat-VerteilungTestgrößeComputeranimationVorlesung/Konferenz
NormalverteilungVarianzWahrscheinlichkeitstheorieMatrizenringZufallsvariableAbbildung <Physik>Arithmetisches MittelErwartungswertFreiheitsgradGlatte FunktionStetige AbbildungZahlenbereichZufallsvektorSummeTransformierteVektort-VerteilungDichte <Physik>Richtungt-TestTestgrößeInvarianzWahrscheinlichkeitsverteilungQuadratKoordinatentransformationTranslation <Mathematik>Vorlesung/Konferenz
EigenwertproblemMengePhysikalische GrößeZufallsvariableErzeugendeVerteilungsfunktionRuhmasseSummierbarkeitDichte <Physik>Fortsetzung <Mathematik>Kartesisches ProduktBiproduktAbbildung <Physik>Dimension nVorlesung/Konferenz
MatrizenringQuadratGesetz <Physik>Abbildung <Physik>KoordinatentransformationSummeVektorBetrag <Mathematik>Dichte <Physik>Offene MengeExponentialfunktionNormaleDimension 1Vorlesung/Konferenz
Funktion <Mathematik>NormalverteilungPhysikalische GrößeMatrizenringQuadratZufallsvariableEinfach zusammenhängender RaumErwartungswertLineare TransformationNorm <Mathematik>SummeVektorLängeSummierbarkeitVektorrechnungVarianzErweiterungTranslation <Mathematik>NormaleComputeranimationVorlesung/Konferenz
QuadratNorm <Mathematik>SummeComputeranimationVorlesung/Konferenz
NormalverteilungVarianzQuadratZufallsvariableErwartungswertSummet-VerteilungZahlFaktorisierungGradientVorlesung/Konferenz
MengeSchaleStichprobeNormalverteilungVarianzStochastikWahrscheinlichkeitsverteilungMittelungsverfahrenQuadratAussage <Mathematik>ErwartungswertFreiheitsgradStatistische HypotheseSchätzungSummeEmpirischer ProzessQuadratzahlKlasse <Mathematik>Optimaler TestEinseitiger TestEnde <Graphentheorie>SignifikanztestBereichsschätzungArithmetisches MittelChi-Quadrat-VerteilungTestgrößeNichtparametrische Regression
Transkript: Deutsch(automatisch erzeugt)
Also ich begrüße Sie noch mal recht herzlich, nein, ich begrüße Sie zum ersten Mal recht herzlich für die letzte Vorlesung, vor Weihnachten war es, glaube ich. Wir leiten heute die Verteilung einiger Prüfgrößen im Zusammenhang mit Tests bei normal verteilten Daten her.
Dafür brauche ich zwei Verteilungen, die ich als erstes definiere. Definition 6.6. Sind x1 bis xn unabhängige n und 1 verteilte Zufallsvariabeln, so heißt die Verteilung von Summe i gleich 1 bis n xi², zentrale Chi-Quadrat-Verteilung mit n Freiheitsgraden.
Sind x1 bis xn unabhängige n und 1 verteilte Zufallsvariabeln, so heißt die Verteilung von Summe i gleich 1 bis n xi², zentrale Chi-Quadrat-Verteilung mit n Freiheitsgraden.
Und kurz ist es dann eine Chi-N-Quadrat-Verteilung. Die zweite Verteilung, die wir brauchen, ist die T-Verteilung.
Da nehmen wir eine standardnormal verteilte Zufallsvariable, eine davon unabhängige Chi-N-Quadrat verteilte Zufallsvariable, bilden einen Pozienten aus der standardnormal verteilten Zufallsvariable und der Wurzel aus der Chi-N-Quadrat verteilten Zufallsvariable geteilt durch die Anzahl der Freiheitsgrade.
Und das Ganze gibt dann eine T-Verteilung mit den entsprechenden Freiheitsgraden. Also Teil b sind xy unabhängig mit x n und 1 verteilt und y Chi-N-Quadrat verteilt.
So heißt die Verteilung von x geteilt durch Wurzel aus y und durch n,
also Verteilung von x geteilt durch Wurzel aus y und geteilt durch n, zentrale T-Verteilung mit n Freiheitsgraden.
Und kurz ist es eben die T-N-Verteilung.
Die Frage ist, wo ist der eine Freiheitsgrad hin?
Bei x haben wir einen, bei y haben wir n. Also warum spreche ich hier von n Freiheitsgraden, nicht n plus 1? Sie haben bei x im Prinzip keinen Freiheitsgrad, weil da steckt ja kein Parameter mehr drin. Das ist ja einfach eine feste Verteilung. Der einzige Freiheitsgrad, den Sie haben, ist in der Tat das n.
Oder sind eben diese n von der Summe. Okay, noch eine Frage. Die eine Verteilung haben wir schon in der Wahrscheinlichkeitstheorie verteilt,
nämlich die Chi-Quadrat Verteilung. Da haben wir uns damals überlegt, wie eine Dichte aussieht von dem Quadrat einer Standard-Normalverteilten-Zufallsvariable. Das konnten wir relativ einfach ausrechnen. Das gab dann eine Gamma-Verteilung und dann hat man eine Faltungseigenschaft für Gamma-Verteilungen.
Das heißt, da kam eine Gamma-Verteilung raus. Das heißt, hier kennen wir eine Dichte und hier gibt es im Prinzip auch eine Dichte. Könnten wir jetzt ausrechnen, möchte ich aber nicht machen, sondern ich schreibe einfach hin, obigen Verteilungen besichtigen Dichte bezüglich des Parallelmaßes und verweise dann auf das Skript, wo die Formeln angegeben sind. Ich weise aber die Formeln nicht mehr hin. Und die Werte der zugehörigen Verteilungsfunktionen, praktil etc. sind vertraffelt.
Also eigentlich ist... Also ich möchte jetzt nicht groß die Verteilung noch untersuchen, sondern wir werden am Schluss eben, oder werden als nächstes dann sehen, dass gewisse Größen eben gerade diese Verteilung haben. Also Bemerkung. Die obigen Verteilungen besitzen Dichten bezüglich des Parallelmaßes.
Und für die Dichten könnte ich auch Formeln hinschreiben, die sind also bekannt. Ich schreibe einfach mal hin das Skript. Und Werte der zugehörigen Verteilungsfunktionen, praktile etc. sind vertraffelt,
beziehungsweise die ganzen Verteilungen sind eben in Standards, Statistikpaketen, die Sie am Rechner haben drin. Das heißt, Sie können die ganzen Verteilungsfunktionen, Werte ausrechnen, Sie können Dichte, Dichtewerte ausrechnen, Sie können praktile sich ausgeben lassen usw.
Werte der zugehörigen Verteilungsfunktionen, kurz ab mit Vf. Fraktile etc. sind vertraffelt.
Und der entscheidende Satz, den wir jetzt heute behandeln und den ich auch beweisen werde,
Satz 6.4. Sind x1 bis xn unabhängig nµ² verteilt? Und definieren wir x² als arithmetisches Mittel der xi und s² als empirische Varianz der xi? Dann gehen erstens x² und s² sind unabhängig. Zweitens x² ist normal verteilt. Dann können wir die Erwartungswertvarianz unmittelbar hinschreiben.
Und drittens, n-1 durch sq mal s² ist eine 4-Quadrat-Verteilung mit n-1 Freiheitsraten. Und viertens, viertel n mal x² minus µ durch s ist eine T-Verteilung mit n-1 Freiheitsraten. Also Satz 6.4.
x1 bis xn unabhängig nµ² verteilt.
Dann gilt A-Teil, x² und s² sind unabhängig.
B-Teil.
Naja, den B-Teil kennen Sie eigentlich schon. Wir haben es nie gezeigt, aber ich habe es Ihnen immer gesagt, die Nachkombinationen von unabhängig normal verteilten Zufallsvariablen sind selbst normal verteilt. Dann wissen Sie, hier kommt eine Normalverteilung raus. Erwartungswert ist arithmetische Mittel der Erwartungswerte, also µ.
Und Varianz ist Varianz von x1 geteilt durch n, also sq durch n.
C-Teil macht eine Aussage über Verteilung von s². Und zwar, wenn ich s² mal n-1 nehme und durch sq teile.
Das heißt, ich bekomme die Summe i gleich 1 bis n, xi minus x² raus, geteilt durch sq. Dann kommt da gerade eine Chi-Quadratverteilung raus, und zwar mit n-1 Freiheitsraten.
Und bei Teil D geht es um die Verteilung der Prüfgröße vom T-Test. Wurzel n mal xq minus µ durch s.
Also Sie wissen, wenn Sie s ersetzen durch die Wurzel aus der wahren Varianz, dann kommt dann eine standard-normal verteilte Zufallsvariable raus. Wenn Sie stattdessen die empirische Variante einsetzen, kommt eine T-Verteilung mit n-1 Freiheitsraten raus.
Wenn Sie sich einen Detail angucken, das sehen Sie schon fast direkt, folgt aus a bis c. Wenn Sie eben zum Beispiel den Nenner entsprechend umschreiben,
dass da eine Wurzel aus einer Chi-Quadrat verteilten Zufallsvariable durch die Anzahl der Freiheitsgrade steht, dann sehen Sie, wie Sie auch den Nenner, den Zähler normalisieren müssen. Dann steht im Zähler eben eine standard-normal verteilte Zufallsvariable, wird sich rausstellen. Und die beiden sind nach a unabhängig, und damit kommt da in der Tat eine T-Verteilung raus.
Also eigentliche Aufgabe ist a und c zu zeigen. Okay, haben Sie Fragen soweit? Keine Fragen? Dann werden wir das Ding jetzt heute beweisen.
Ich brauche dazu einen Lemma. Das Lemma besagt, wenn ich standard-normal verteilte Zufallsvariablen
durch ein n-Stück, durch eine autogonale n-Kreuz-n-Matrix transformiere. Das heißt, ich nehme diesen einen Vektor, stecke ihn in die, wende die autogonale n-Kreuz-n-Matrix drauf an, bekomme einen zweiten Vektor von Zufallsvariablen. Und die Zufallsvariablen, die daraus kommen, sind die Behauptung genauso standard-normal verteilt.
Das gibt Lemma 6, 1. Sind y1 bis yn unabhängig n, 0, 1 verteilt?
a ist eine sogar autonormale n-Kreuz-n-Matrix.
Damit meine ich, dass a transformiert a gleich die Einheitsmatrix ist. Und z1 bis zn definiere ich, indem ich auf den Vektor y1 bis yn die Matrix a anwende.
Und dann ist die Behauptung, z1 bis zn sind ebenfalls unabhängig n, 0, 1 verteilt.
Kennen Sie irgendeinen Satz aus der Wahrscheinlichkeitstheorie, der Ihnen dieses Lemma ganz schnell erschlagen würde?
Irgendeine Idee, Satz aus der Wahrscheinlichkeitstheorie, mit dem Sie dieses Lemma ganz schnell beweisen könnten?
Oder bräuchten Sie jetzt irgendeinen Satz, der Ihnen eine Aussage macht über die Verteilung von so einer transformierten Zufallsvariable?
Satz von der stetigen Abbildung, naja, Satz von der stetigen Abbildung war die Aussage xn gegen x nach Verteilung, h stetig, h von xn gegen h von x nach Verteilung. Also Sie haben natürlich Recht, man verändert hier eine Abbildung an, und die Abbildung ist stetig. Nur haben Sie keine Verteilungskontagenz.
Aber es geht insofern in die richtige Richtung. Also was wir machen, wir wenden eine Abbildung auf einen Zufallsvektor an, und wir wollen dann eine Aussage haben, was passiert, nachdem wir eine Abbildung angewendet haben. Noch ein Versuch.
Es gibt einen Transformationssatz, es gibt einerseits einen Transformationssatz allgemein, also der besagt sowas, oder so wie ich es bezeichne, so ein Erwartungswert von h von x. Können Sie umschreiben, oder integral von über, also ein integral von h von x dp
können Sie umschreiben als ein integral dp, dp x. Das ist der Transformationssatz, was ich als Transformationssatz mache. Und dann gibt es nochmal einen Satz, und das ist der Transformationssatz für Dichten. Also es gibt einen Satz, der sagt Ihnen, wenn Sie hier eine schön glatte Funktion anwenden und das Ding hat eine Dichte, dann hat das andere auch wieder eine Dichte,
und Sie können die Dichte eigentlich mit dieser multidimensionalen oder hochdimensionalen Substitutionsregel berechnen, mehr oder weniger. Das ist der richtige Satz. Haben wir in der Wahrscheinlichkeitstheorie nur als Bemerkung gemacht. Ich habe ihn gar nicht groß bewiesen, weil ich gesagt habe, der Beweis ist irgendwie nicht so spannend oder auch nicht so toll.
Ich habe, glaube ich, auch gesagt, man braucht ihn nie. Also hier wäre die eine Sache, wo wir ihn mal brauchen. Und ich werde den Beweis jetzt eben gleich nochmal mitmachen. Aber im Prinzip, mit so einer Formel hätten wir es ganz schnell erschlagen. Wir kennen eine Dichte hier, und dann können wir sofort eine Dichte von Z1 bis Zn hinschreiben. Aber ich beweise das Ding gleich nochmal mit.
Okay, Beweis. Wir zeigen die Beziehung, die nennen Sternen.
Nämlich die gemeinsame Wahrscheinlichkeit, dass Z1 kleiner gleich klein Z1 ist bis Zn kleiner gleich klein Zn, druck ich als ein Integral aus.
Und zwar integral über die Dichte von so einem N-Tupel von unabhängigen Standard normal verteilten Zufallvariablen.
Und das zeigen wir für alle Z1 bis Zn aus R.
Und der erste Schritt im Beweis ist jetzt zu sehen, das impliziert die Behauptung. Kann man das jemand von Ihnen sagen? Wie folgt, wenn wir sobald für die Beziehung Sternen gezeigt haben, wie folgt daraus die Behauptung?
Also das hier ist die Verteilungsfunktion von der n 0 1 verteilten Zufallvariable. Und damit haben wir. Und damit ist eindeutig. Das ist eine Argument Sache, wie wir argumentieren können.
Die andere ist andere Argument, was ich jetzt hier geben konnte, war unmittelbar über den Beweis von der Aussage, die Sie haben. Ich wende hier die Fortsetzung Satz für Maße. Also setze zur eindeutigen Fortsetzung des Maßes an. Ich habe hier einen Erzeuger der N-dimensionalen Borelischen Sigma-Algebra. Für diesen Erzeuger stimmt dieses Maß hier.
Wahrscheinlichkeit, dass Z1 bis Zn in diesem Intervall Kreuzprodukt von Intervallex liegt, mit diesem Maß hier integral über diese Menge, über diese Funktion überein. Dann stimmt das Maß auf der ganzen Borelischen Sigma-Algebra überein. Wir haben hier endliche Maße vorlegen, die gleich sind auf dem Erzeuger.
Und da das hier jetzt die Dichte von so einem N-Tupel von unabhängigen Standard-Normalverteiden zufallsvariablen ist, folgt dieses Z1 bis Zn hat diese Dichte. Und ist damit selbst, hat eben diese Verteilung wie, oder ist selbst,
Z1 bis Zn ist selbst unabhängig identisch Standard-Normalverteid. Also dies impliziert die Behauptung. Denn aus Stern folgt das Produkt von, dass die Dichte von Z1 bis Zn das Produkt von N-Dichten von unabhängigen N01-verteiden zufallsvariablen ist.
Denn aus Stern folgt eben mit den Fortsetzungssätzen für Maßen,
dass die Dichte von Z1 bis Zn das Produkt von N-Dichten von,
oder gleich der Dichte von einem N-Tupel von unabhängigen N01-verteiden zufallsvariablen ist,
gleich der Dichte von einem N-Tupel von unabhängig identisch verteidenden zufallsvariablen ist. Also unabhängig identisch N01-verteidenden zufallsvariablen ist.
Und wenn eben die Dichte die richtige Form hat, dann hat auch die Verteilung die entsprechende Form.
Okay, damit bleibt noch Stern zu zeigen.
Kommen wir zum Nachweis von Stern.
Ich setze dieses, oder wähle mal Z1 bis Zn aus R beliebig und setze dieses Kreuzprodukt von diesen halboffenen Intervallen als I. Für Z1 bis Zn Element R beliebig, setze I gleich Intervall von Minus und Endlich bis Z1,
Kreuzintervall von Minus und Endlich bis Z2 und so weiter bis Intervall von Minus und Endlich bis Zn. Dann gilt, ich interessiere mich für diese linke Seite von Stern,
also Wahrscheinlichkeit, dass Groß Z1 gleich Klein Z1 ist und so weiter. Das ist jetzt nichts anderes als das Z1 bis Zn, in dem Intervall I drin liegt.
Ich weiß, Z1 bis Zn ist A mal Y1 bis Yn.
Also kann ich einsetzen.
Dann kann ich mit A oben Minus 1 durchmodifizieren. Und ich weiß auch, weil A transponiert A gleich 1 ist, ist die inverse Abbildung von A eben gerade A transponiert. Daraus folgt auch sofort, dass A mal A transponiert gleich 1 ist. Und dass eben A transponiert, die inverse zu A ist.
Das heißt, weil ich weiß, dass A transponiert A die Einheitsmatrix ist.
Dann kenne ich eine Dichte von Groß Y1 bis Yn.
Das ist einfach, weil die unabhängig sind, das Produkt der einzelnen Dichten. Und die sind jeweils standardnormal verteilt. Das heißt, das ist das entfache Produkt der einzelnen Dichten. Das heißt, ich komme hier auf Integral über A transponiert I.
Dichte von G, von kleinen Y1 bis Yn.
Wobei eben dieses G, das ist dieses Produkt von den standardnormal
verteilten Dichten oder Dichten der Standardnormalverteilung ausgewerteten Stellen Y1 bis Yn.
Da eben die Y1, Groß Y1 bis Yn unabhängig sind. Jeweils mit Dichte 1 durch Wurzel 2 Pi mal E hoch minus Y Quadrat halbe.
Ich kann das Produkt noch als Summe in die Exponentialfunktion ziehen.
Dann steht hier E hoch minus Summe I gleich 1 bis N Y I Quadrat. Und dieses Summe der Quadrate kann ich schreiben als liegender Vektor. Y1 bis Yn multipliziert mit dem stehenden Vektor.
Jetzt wenden Sie den Transformationssatz an. Also ich schreibe hier mal weiter. Das wird der Transformationssatz.
Also ich muss gestehen, das ist der Satz, den ich mir nie merken kann. Aber vielleicht kann mir jemand von Ihnen sagen, also ich setze jetzt irgendwie. Ja, was mache ich denn? Ich setze X1 bis Xn als A transponiert Y1 bis Yn.
Oder kann mir jemand von Ihnen sagen, was jetzt hier passiert? Also ich will ja das A transponiert irgendwie hier reinbekommen.
Das heißt, ich möchte eigentlich sowas schreiben. Integral über I. Dann habe ich einen Gy1 bis Yn. Dann haben wir hier einen A transponiert.
Richtig. Y1 bis Yn. Beziehungsweise wir nennen es vielleicht neu als X1 bis Xn. Dann brauchen wir eine Korrektur hier noch. Dann integrieren wir bezüglich X1 bis Xn.
Und die Korrektur? Der Nennte von dieser Matrix, also der Nennte von A transponiert. Und eigentlich steht hier als Korrektur. Ja, hier steht als Korrektur.
Aber wenn hier eine allgemeine Funktion F stehen würde, steht hier als Korrektur. Okay, die Nennte von der Jacobi-Matrix. Wenn Sie ans Eindimensionale denken. Sie integrieren von Minus 1 bis 1. Vielleicht Xdx.
Und ich nehme als Abbildung einfach X wird abgebildet auf Minus X. Dann haben Sie ein Problem. Weil die Grenzen müssen Sie eigentlich umdrehen. Aber Sie würden hier die Grenzen nicht umdrehen, wenn Sie dabei stehen lassen. Wir nehmen den Betrag. Da steht der Betrag.
Und ich glaube so könnte es stehen. Und vermutlich habe ich Y1 bis Yn als A transponiert mal X1 bis Xn gesetzt.
Beziehungsweise vermutlich habe ich als A mal X transponiert X gesetzt. Ja, das sind die Stellen. Substitutionsregeln mehrdimensional. Vielleicht sollte man doch mal die Analyses 1 lesen. Oder 2 oder 3.
Ich habe das gemacht. Ich würde X1 bis Xn als A um Minus 1 mal Y1 bis Yn setzen.
Ja gut, glauben wir es mal. Noch Fragen dazu?
Okay. Jetzt gucken wir uns das an. Wenn wir das angucken, dann sehen Sie, warum ich die Funktion da oben hingeschrieben habe.
Das ist jetzt 1 durch Wurzel 2 Pi n. 2 Pi hoch n. Mal e hoch. Jetzt kommt ein Minus ein halb Mal. Jetzt der liegende Vektor. Also X1 bis Xn.
Mal A. Und dann der entsprechende stehende Vektor A transponiert. Und dann sehen Sie, dieses A mal A transponiert gibt wieder die Einheitsmatrix.
Das heißt, es gibt in der Tat 1 durch Wurzel 2 Pi hoch n mal.
Und das war das, was wir eigentlich beim Integral haben wollten. Nämlich Produkt i gleich 1 bis n. 1 durch Wurzel 2 Pi mal e hoch Minus xi Quadrat Heide. Das können wir vielleicht auch noch hinschreiben.
Dann haben wir die hier noch. Und wie Sie vorhin schon treffen gemerkt haben, die ist gleich 1. Da eben A transponiert, A gleich 1 war.
Wir hatten eine autonormale Matrix. Und dann sehen Sie, sind wir fertig.
Fragen soweit?
Und eben mit diesem Transformationssatz für Dichten hätten wir eigentlich die Formel für die Dichte mit einem Schlag gehabt. Das wäre diese Formel hier gewesen. Aber wir haben halt gleich nochmal bewiesen oder diesmal bewiesen in dem Spezialfall.
Ja, wenn Sie keine Fragen hatten, würde ich sagen, machen wir 5 Minuten Pause zum Tafelwischen.
Seien also x1 bis xn unabhängig n Mu Sigma Quadrat verteilt.
Ich setze y1 gleich x1 minus Mu durch Sigma. yn gleich xy2 entsprechend bis yn gleich xn minus Mu durch Sigma. Die Zufallsvariablen sind dann jeweils auch normal verteilt. Und zwar Erwartungswert ist 0, Variant 1. Das heißt, die sind unabhängig n 0 1 verteilt.
Dann sind y1 gleich x1 minus Mu durch Sigma bis yn gleich xn minus Mu durch Sigma unabhängig n 0 1 verteilt.
Also unabhängig klar, weil es eben jeweils eine Funktion der einzelnen Zufallsvariablen sind. Und normal verteilt auch klar, weil wir ja nur so eine lineare Transformation von der Normalverteilung machen. Und standard Normal verteilt eben, weil Erwartungswert 0, Variant 1 ist.
Jetzt wähle ich eine autogonale Matrix A mit 1. Zeile gleich. Ok, schreibe ich gleich hin, wähle autogonale Matrix A.
Naja, wenn ich schon vorhin autonormal geschrieben habe, sollte ich jetzt auch autonormal schreiben. Autonormale Matrix A gleich in Vektor e transponiert, der lauter Einträger 1 durch Wurzel aus n hat.
Also n hoch minus ein halb als n-dimensionalen Vektor.
Ok, warum kann ich das? Warum finde ich eine autonormale Matrix, wo die erste Zeile gleich dem Vektor ist, der n-Einträge gleich 1 durch Wurzel aus n hat?
Ok, der hat Länge 1. Erste Beobachtung, das ist ein Einheitsvektor. Also wenn die eukligischen Normen ausrechnen, dann nehmen Sie die ganzen Komponenten zum Quadrat,
summieren auf, kommt 1 raus. Und dann erweitern Sie das ganze Ding eben, oder dann nehmen Sie den als Ausgangspunkt für eine Basiserweitung mit einem Verfahren von Grabe-Schmidt und machen eine autonormale Basis, die diesen als ersten Eintrag hat. Und die schreiben Sie dann in die einzelnen Zeilen rein. Und dann setzen wir und setze jetzt z gleich z1 bis zn.
Das wäre a mal y1 bis yn.
Nach Lemma 6.1 wissen wir dann, die z1 bis zn sind unabhängig standardnormal verteilt. Und was wir jetzt machen, ist, wir stellen die interessierenden Größen als Funktionen der z1 bis zn da. Also nach Lemma.
Und dann im Folgenden, wir stellen die gesuchten Größen als Funktionen der z1 bis zn da.
Stellt sich die Frage, warum ist das eine gute Idee? Na ja, zwei Gründe.
Wir wissen, wie z1 aussieht. Z1 ist nämlich dieser Vektor, liegende Vektor, mal y1 bis yn. Und dann können wir x1 bis xn, oder die Definition von y1 bis yn, einsetzen. Und werden sehen, das hat etwas mit x quer zu tun haben. Und zweitens, wir wissen, die Länge von diesem z1 bis zn stimmt mit der Länge von den y1 bis yn zusammen.
Oder ist die gleiche wie die Länge von y1 bis yn, weil die Matrix hier ja autonormal ist. Also die Länge bleibt gleich. Als Folgerung hat die Summe der Quadrate hier was mit den Summen der Quadraten hier zu tun. Die Summe der Quadrate hier wird was mit den Summen der Quadraten der xi zu tun haben.
Und das wird doch relativ nützlich sein. Richtig? Okay, fangen wir mal an. Also dazu.
Wir überlegen uns also z1, ist ja e-transponiert mal bis yn. Das heißt, können Sie hinschreiben.
Das ist die Summe. Nennen wir es vielleicht i gleich 1 bis n. 1 durch Wurzel aus n. Also hier war es die Definition e. Oder hier haben wir die Definition z.
Z1. Hier haben wir die Definition e. Hier setzen wir jetzt die Definition der yi ein.
Dann kommen wir auf... Also yi ist xi minus mu durch sigma.
Dann können Sie es auseinander ziehen. Also eins durch sigma und eins durch Wurzel n nach vorne. Dann bleibt noch die Summe der xi übrig.
Na gut, machen wir es ausführlich. Also wir haben eins durch Wurzel aus n. Eins durch sigma mal Summe i gleich 1 bis n.
xi minus n mal mu.
Das gibt dann, wenn ich es mit x quer umschreibe. Also x quer hat ja hier noch ein eins durch n. Also muss ich mit Wurzel n multiplizieren. Bekomme ich Wurzel n durch sigma mal x quer.
Minus Wurzel n mal mu durch sigma.
Beziehungsweise ich kann noch x quer auflösen. Beziehungsweise x quer wäre jetzt gleich...
Ja, wir machen sigma mal z1. Na ja, eigentlich ist es trivial.
Na gut, also sigma mal z1. Plus... Oder sigma mal z1.
Vielleicht gleich noch geteilt durch Wurzel n. Und damit sehen Sie schon mal unmittelbar die Verteilung von x quer. Aber das war ja auch der Trivialteil.
Das zweite, was ich mir angucke, ist die Summe der zi-Quadrat.
Das wäre die Norm von den euklidischen Normen zum Quadrat von z1 bis zn.
Weil a auch normal ist, wissen wir, das ist das gleiche wie die euklidische Norm von y1 bis yn, yi zum Quadrat.
Das dritte, was ich mir angucke, ist n minus 1 mal s Quadrat.
Nach Definition i gleich 1 bis n. xi minus x quer zum Quadrat. Wir wissen, yi ist xi minus mu durch sigma. Das heißt, xi ist gleich sigma mal yi plus mu.
Daraus sehen Sie sofort, das x quer ist sigma mal y quer plus mu.
Das heißt, wenn ich xi minus x quer ausrechne, dann hebt sich das mu raus. Und ich habe das sigma noch übrig. Und das sigma kann ich dann quadratisch rausziehen. Also sigma Quadrat mal yi minus y quer zum Quadrat.
Und dann kann ich hier ausmultiplizieren. Ich bekomme Summe i gleich 1 bis n yi Quadrat. Dann minus 2 mal y quer mal Summe i gleich 1 bis n yi.
Und plus n mal y quer zum Quadrat. Das n mal y quer zum Quadrat ist das gleiche wie die Summe i gleich 1 bis n yi mal y quer. Das heißt, das minus 2 plus 1 mal hebt sich weg. Und ich komme hier auf sigma Quadrat mal yi zum Quadrat.
Und dann insgesamt nur minus 1 mal x quer zum Quadrat.
Okay, und jetzt kommt der eigentliche Trick im Beweis. Oder warum sich alles in Wohlgefällen auflöst.
Wir lassen das erste Mal stehen. Dann das zweite. Ich ziehe das n mal rein in das Quadrat. Dann steht da 1 als Wurzel n.
Ich ziehe es rein. Mit dem Vorfaktor 1 durch n gibt man 1 durch Wurzel n. Und dann sehen Sie dieses 1 durch Wurzel n mal Summe j gleich 1 bis n yj. Das müsste jetzt hier auch irgendwo.
Steht da oben noch. Summe i gleich 1 bis n. 1 durch Wurzel n mal yi. Das ist gerade z1. Das heißt, das hier ist z1.
Während das zweite, was wir hier haben, war ja auch nach hier oben gerade die Summe der Quadrate der zi Quadrat.
Und damit sind wir eigentlich fertig mit dem Beweis. Weil jetzt steht da sigma Quadrat mal die Summe i gleich 2 bis n zi Quadrat.
Und jetzt haben Sie eben x quer, haben wir ausgedruckt, als eine Funktion von z1.
Z1 kennen wir die Verteilung. Kennen wir die Verteilung hier auch. Und dieses n minus 1 mal s Quadrat haben wir ausgedruckt als eine Funktion von z2 bis zn. Von z2 bis zn kennen wir auch die Verteilung. Auch unabhängig standardnormal verteilt. Dann sehen Sie, wenn ich hier noch durch sigma Quadrate teile,
kommt hier eine chi n minus 1 Quadrat Verteilung raus. Und da oben kommt eine Normalverteilung raus. Und die beiden sind unabhängig. Okay, also ich schreibe es noch hin.
Damit zeigen müssen wir, ja Satz 6-4 steht nicht mehr da. A-Teil wollen wir argumentieren, dass x quer und s Quadrat unabhängig sind.
x quer ist, wo steht x quer? Da vorne. Sigma durch Wurzel n mal z1 plus mu. Und s Quadrat steht hier.
Ich teile das durch n minus 1 durch. Und weil jetzt eben z1 bis zn unabhängig ist, die erste Zufallsvariabel nur von z1 abhängt.
Und die zweite von z2 bis zn, sind auch die beiden unabhängig.
Okay, A-Teil, B-Teil, da geht es um die Verteilung von x quer. x quer ist sigma durch Wurzel n.
mal z1 plus mu. Da jetzt eben z1 Standard normal verteilt ist, ist x quer auch normal verteilt und wenn Sie Erwartungswert ausrechnen, kommt 0 plus mu, also mu, raus. Varianz ausrechnen, kommt sigma quadrat durch n raus.
Also n, mu, sigma quadrat durch n verteilt. Da z1 eben n0,1.
C Teil. C Teil ging es um die Verteilung von n minus 1 sigma quadrat durch s quadrat.
Wenn wir uns das angucken, verteilen wir das noch durch sigma quadrat. Dann sehen wir, das ist gerade i gleich 2 bis n zi quadrat.
Und jetzt haben wir eben die Quadrate von n minus 1 unabhängigen Standard normal verteilt in Zufallsvariablen. Dann kommt hier eine chi n minus 1 Quadrat Verteilung raus. Und für ein D Teil muss ich doch noch mal wischen.
Als D Teil interessieren wir uns für Wurzel n mal x quer minus mu durch s.
Kann mir vielleicht von Ihnen jemand sagen, wie man sieht, dass da eine T-Verteilung rauskommt?
Sieht irgendjemand, warum da eine T-Verteilung rauskommt? Wir haben das x quer da oben gegeben. Also einfach nur einsetzen, x quer mal war sigma mal z1 durch Wurzel n mal plus mu. Das heißt, wenn ich x quer minus mu mal Wurzel n ausrechne, dann kommt sigma durch z1 raus.
Wenn ich s einsetze, ja s ist die Wurzel aus s Quadrat. Wenn ich s Quadrat einsetze, das haben wir da ausgerechnet. Das ist sigma Quadrat durch n minus eins, Summe i gleich zwei bis n, z i zum Quadrat.
Und dann sehen Sie, dann kürze ich das sigma Quadrat raus mit dem sigma hier. Das heißt, es bleibt übrig z1 durch Wurzel aus i gleich zwei bis n,
z i Quadrat durch n minus eins. Und jetzt sind die z1 bis zn unabhängig Standard normal verteilt. Das heißt, diese Summe i gleich zwei bis n, z i Quadrat ist eine Chi-Quadrat-Verteilung mit n minus eins Freiheitsgraden. Die ist natürlich unabhängig von dem z1 oben. Das heißt, hier steht gerade die
Formel, die wir in der Definition der T, n minus eins Verteilung haben. Und wir sind fertig.
Okay, haben Sie noch Fragen soweit? Dann kann ich Ihnen vielleicht noch ein paar Prüfungsfragen präsentieren. Am Ende zum Unterschied.
Also wieder so ein Punkt, wo wir eine Viertelstunde vor Ende der Vorlesung sind. Aber alles, was ich jetzt noch hinschreibe, müsste ich in der nächsten Vorlesung wieder auf eine Wiederholungsfolie draufschreiben. Das heißt, es wäre irgendwie kein guter Deal.
Aber vielleicht kann ich Ihnen noch ein paar Prüfungsfragen zeigen. Und dann hören wir zehn Minuten früher auf oder so. Ich glaube, Frage
Nummer 34 hatten wir wahrscheinlich schon. Wie konstruiert man einen optimalen einseitigen Test zum Niveau Alpha bei Vorliegen einer Klasse mit monotonen Dichteprozenten in T? Dann Frage Nummer 35.
Wie testet man ausgehend von einer B1P verteilten Stichprobe H0P klarer gleich P0 versus H1P größer P0 zum Niveau Alpha? Da müssten Sie eben jetzt argumentieren können, dass diese B1P-Verteilung, diese N-Tubel von unabhängigen B1P-Verteilungen eben der Klasse mit monotonen Dichteprozenten in dieser Summe sind.
Das war ja die obelige Frage. Und dann müssten Sie entsprechend den optimalen Test angeben können. Und beteil, wie modifiziert man diesen Test sinnvollerweise, um ihn bei Hypothesen jetzt ein zweiseitiges Problem mal
H0 quer P gleich ein halb versus H1 quer P ungleich ein halb anwenden zu können? Ja, da überlegen Sie sich. Von der Summe der XI gehen Sie über zum 1 durch N mal Summe der XI, arithmetisches Mittel. Und wenn das eben stark von ein halb abweicht, lehnen Sie ab.
Und da müssen Sie sich überlegen, wann kommt da ein Test zum Niveau Alpha raus? Frage Nummer 36. Was versteht man unter einer QN-Quadratverteilung beziehungsweise einer zentralen TN-Verteilung? Das war die Definition von heute.
Frage Nummer 37 trifft genau die Aussage von den Satz 6, 4.
Sind X1 bis XN unabhängig N mu Sigma Quadrat verteilt? Welche Aussagen können Sie dann über die Verteilung von X quer, arithmetisches Mittel der XI und S Quadrat empirische Variants machen? Eben diese Aussagen von gerade eben, also X quer S Quadrat sind unabhängig verteilt. X quer ist eine Normalverteilung, können Sie hinschreiben S Quadrat.
Wenn Sie es entsprechend modifizieren mit N minus 1 und durch S Quadrat teilen, kommt eine XI-Quadratverteilung mit N minus 1 Freiheitsgraden raus. Und dann kommen noch jede Menge Fragen zu Tests.
Aber die kommen dann beim nächsten Mal. Also Standard-Testproblem H0 mu kleiner gleich mu Null versus H1 mu größer mu Null. Bei bekannter Variante ist der Gaustest, bei unbekannter Variante ist der T-Test, den wir beim nächsten Mal behandeln werden. Kennen Sie schon aus der Einführung die Stochastik.
Dann kommt ein zweiseitiges Testproblem beziehungsweise umgedrehte Hypothesen. Werde ich das nächste Mal mit dem Merkmal dazu machen. Dann kommen Tests für die Variants. Das wird mit der Prüfgröße von gerade eben gehen, dem S Quadrat, wo Sie eben wissen, da kommt mehr oder weniger eine XI-Quadratverteilung raus. Können Sie dazu Tests machen. Und dann kommt noch Tests, ein Zwei-Stich-Proben-Problem, wenn Sie
zwei Normalverteilungen mit verschiedenen Erwartungswerten, aber gleicher Variants gegeben haben, wie Sie dann Aussagen über die Erwartungswerte machen können. Das machen wir alles in der ersten Stunde nach Weihnachten, also am 10. Januar.
Anschließend machen wir ein bisschen Bereichsschätzung. Dann kommen noch paar nicht-parametrische Tests, das geht auch recht schnell. Ich nehme an, wir werden so die ersten drei Wochen vielleicht noch nach Weihnachten brauchen. Und dann bin ich eigentlich durch mit meiner Vorlesung, was irgendwie bei mir große Verwunderungen immer
ausgelöst hat, weil ich kann da nicht drei Wochen vor Semesterende mit meiner Vorlesung durch sein. Und ich muss sagen, ich habe da lange nachgedacht und dann ist mir eingefallen, ja, ich habe ja noch das Buch von der Frau Sarah Wanderger im Schrank über empirische Prozesstheorie und ich fange dann einfach damit an. Das ist eine tolle Sache.
Also es gibt zwei Sachen. Ich könnte, Sie haben vielleicht gemerkt, ich mache die Vorlesung ja irgendwie kürzer als vor zwei Jahren. Insbesondere ich habe die Beispiele ein bisschen raus gestrichen, weil das natürlich auch ein bisschen langweilig ist, wenn ich Ihnen hier so eine Anwendung vorrechne. Und einerseits ist es ganz schön, so eine Anwendung, wenn Sie mal sehen, wie es wirklich
geht, aber andererseits ist es extrem langweilig, wenn ich Ihnen so einen Test vorrechne oder so. Also das können Sie im Prinzip auch selber in Übungen machen. Das heißt, es wäre mal ein bisschen Übungen verlagern. Ich werde auch noch mal ein bisschen Beispiele raus streichen, dann habe ich noch ein bisschen Zeit mal auch so ein bisschen so ein bisschen, wie soll man sagen. Also bisher sind wir ja, ich weiß nicht, was das jetzt gerade ist, wahrscheinlich so 50er Jahre vom letzten Jahrhundert.
Wir kamen bisher Satz von Stone, war aus dem Jahr 77 und auch diese nichtparametrische Regression eher so 80er Jahre. Aber das Buch von der Frau Wanderger ist dann eher so 1995. Also wir machen noch mal so einen kleinen Zeitsprung nach vorne. Ok, damit habe ich mich über die Zeit noch nicht ganz gerettet, aber 10 Minuten kann ich ihn auch zu Weihnachten erlassen und mir auch.
Und verbleibe und kann ihn nur noch also frohe Weihnachten wünschen. Guten Rutsch und so weiter und wir sehen uns dann im neuen Jahr.