We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Test von Komogorow-Smirnow

00:00

Formal Metadata

Title
Test von Komogorow-Smirnow
Title of Series
Part Number
22
Number of Parts
28
Author
License
CC Attribution - NonCommercial - ShareAlike 3.0 Germany:
You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal and non-commercial purpose as long as the work is attributed to the author in the manner specified by the author or licensor and the work or content is shared also in adapted form only under the conditions of this
Identifiers
Publisher
Release Date
Language

Content Metadata

Subject Area
Genre
Abstract
Aufgabe der Statistik ist es, Rückschlüsse aus Beobachtungen zu ziehen, die unter dem Einfluss des Zufalls enstanden sind. Diese Vorlesung gibt eine umfassende Einführung in die zugehörige mathematische Theorie. Behandelt werden u.a.: Hauptsatz der Mathematischen Statistik, Dichteschätzung, nichtparametrische Regressionsschätzung, Punktschätzverfahren, statistische Tests, Bereichsschätzverfahren.
Mathematical statisticsCumulative distribution functionSample (statistics)Absolute valueRandom variableStatistical hypothesis testingNormal distributionConfidence intervalPhysical quantityEstimationSampling (statistics)Pivot elementSubsetFunction (mathematics)VarianceContinuous functionExpected valueSet (mathematics)SupremumTestgrößeStochasticAxiom of choiceEmpirical distribution functionConfidence intervalQuantileComputer animationLecture/Conference
Random variableFunction (mathematics)Empirical distribution functionCumulative distribution functionProbability theoryGleichverteilungThomas KuhnSampling (statistics)SupremumVerallgemeinerte InverseContinuous functionStatistical hypothesis testingSimulationDirection (geometry)
Moving averageSet (mathematics)Greatest elementMassWahrscheinlichkeitsmaßCumulative distribution functionVerallgemeinerte InversePropositional formulaRandom variableLecture/Conference
Set (mathematics)Greatest elementComplementarityCumulative distribution functionZahlInverse elementLecture/Conference
Continuous functionCumulative distribution functionCodomainGleichverteilungLimit of a functionGenerating functionEnde <Graphentheorie>EquationLecture/Conference
Set (mathematics)SubsetConnected spaceFunction (mathematics)ZahlNumberRandom variableEquals signSupremumLecture/Conference
Cumulative distribution functionRandom variableContent (media)Probability distributionStochastic processGleichverteilungAsymptotische VerteilungDirection (geometry)Inversion (music)Continuous functionEmpirical distribution functionMittelungsverfahrenAbsolute valueLimit of a functionSquareTestgrößeArithmetic meanSupremumStatistical hypothesis testingFunctional (mathematics)Series expansionSeries (mathematics)Computer animationLecture/Conference
Random numberCumulative distribution functionProbability distributionLattice (order)Sample (statistics)Random variableCalculationAbsolute valueRootPropositional formulaTestgrößeSquareSupremumSeries (mathematics)Physical quantitySampling (statistics)Empirical distribution functionAsymptotische VerteilungLecture/Conference
Transcript: German(auto-generated)
Ja, ich begrüße Sie recht herzlich zur heutigen Vorlesung in der mathematischen Statistik. Wir haben beim letzten Mal behandelt die Bereichsschätzungen. Wir haben unabhängige identisch verteilte Zufallsvariablen.
Die Verteilung von x1 sei gleich ein Wteta für ein Teta aus Teta. Wir haben ein G von Teta nach R ober K. In diesem Setting heißt C von x1 bis xn eine Teilmenge von R ober K. Das ist der Konfidenzbereich zum Konfidenzniveau 1 minus Alpha, falls die Wahrscheinlichkeit, dass G von Teta Element C von x1 bis xn ist, größer gleich 1 minus Alpha ist.
Und das simultan für alle Teta. Also ganz egal, was für eine Verteilung Wteta x1 hat. Wir haben das dann auf zwei verschiedenen Arten konstruiert. Erstens mit stochastischen Pivots. Wir haben gesetzt, unser G von Teta ist Element C von x1 bis xn, genau dann, wenn eine Zufallsvariable Q von x1 bis xn, G von Teta in Menge B liegt.
Wobei dieses Q eben die Eigenschaft haben soll, dass die Verteilung von Q nicht von Teta abhängt. Also gleiche Verteilung für alle Teta. Und B wird so gewählt, dass Q mit Wahrscheinlichkeit 1 minus Alpha in B liegt.
Zweite Möglichkeit war die Konstruktion mit statistischen Tests. G von Teta ist ein Element C von x1 bis xn, wenn x1 bis xn im Nicht-Ablehnungsbereich von H0 A von G von Teta eines Tests zum Niveau Alpha ist.
Wobei für Teta gleich Teta 0, wir bei diesem Test testen H0 G von Teta gleich G von Teta 0 versus H1 G von Teta ungleich G von Teta 0. Wir haben dann schon angefangen mit dem, was wir heute machen, den Grundlagen vom Test von Kolmogorov-Smyrnov.
Wir haben unabhängig identisch verteilte Zufallsvariable mit Verteilungsfunktion F. Wir wollen testen, F ist gleich einer vorgegebenen Verteilungsfunktion F0 als Nullhypothese oder F ist ungleich diesem F0 als Alternativhypothese.
Dazu setzen wir Fn von T als empirische Verteilungsfunktion zu x1 bis xn. Das heißt, Fn von T gibt die Anzahl der Indizes i an, wo xi kleiner gleich t ist, geteilt durch n. Wir wissen, dass nach Clivenco-Cantelli das Supremum über T aus R von Fn von T minus
F0 von T gegen Null konvergiert, wenn F0 die wahre Verteilung ist und haben dann die Idee, ja, dann lehnen wir eben H0 ab, falls dieses Supremum größer als einem kritischen Wert ist und um die Wahl von dem kritischen Wert geht es heute.
Ach so, ich wollte noch was sagen zu Prüfungsfragen. Frage Nummer 42, was versteht man unter einem Konfidenzbereich zum Konfidenzniveau 1 minus alpha und wie kann man einen solchen mithilfe von stochastischen Pivots konstruieren? Frage Nummer 43, leiten Sie mithilfe eines geeigneten stochastischen Pivots ein Konfidenzintervall
zum Konfidenzniveau 1 minus alpha für den Erwartungswert einer normal verteilten Stichprobe her? Frage Nummer 44, wie kann man einen Konfidenzbereich zum Konfidenzniveau 1 minus alpha ausgehend von statistischen Tests konstruieren?
Und erläutern Sie das Vorgehen anhand der Konstruktion eines Konfidenzintervalls für die Varianz einer normal verteilten Stichprobe? Okay, dann räume ich mal den schnell beiseite und versuche die Kabel so hinzulegen, dass ich hier nicht drüber stolpere.
Okay, dann beschäftigen wir uns mit der Wahl des kritischen Wertes bei dem Test von Kolmogorov-Smirnov oder bei dieser Idee von gerade eben. Und dazu verwenden wir Satz 8.1. Satz 8.1 sagt, dieses Supremum T aus R fn von T minus f von T, was wir hier als Größgröße
betrachten wollen, wenn eben f die wahre Verteilungsfunktion ist oder wenn f gleich unserem f0 ist und es wäre die wahre Verteilungsfunktion und die fn von T ist die empirische Verteilungsfunktion zu unabhängig identisch verteilten reellen Zufallsvariablen.
Wenn wir jetzt annehmen, dass diese wahre Verteilungsfunktion eine stetige Verteilungsfunktion ist, dann hängt die Verteilung von dieser Größgröße nicht von der Verteilung der Zufallsvariablen ab, also nicht von f ab. Und damit können wir die gleichen Quantile eigentlich oder Fraktile verwenden für
alle möglichen Tests, also ganz egal, was dieses h0 eigentlich dann ist. Okay, kommen wir zu Satz 8.1. Sind x1 bis xn unabhängig identisch verteilte reelle Zufallsvariablen mit stetiger Verteilungsfunktion f, so hängt die Verteilung von
Supremum über T aus R, Betrag von fn von T minus f von T, nicht von f ab.
Sind die x1 bis xn unabhängig identisch verteilt mit stetiger Verteilungsfunktion f, so hängt die Verteilung von
Supremum T aus R, Betrag von fn von T minus f von T, nicht von f ab.
Damit können wir bei stetiger Verteilungsfunktion diesen kritischen Wert C einfach als Alpha-Fraktil von dieser Prüfgröße nehmen, wo wir hier eben beliebige Zufallsvariablen einsetzen,
mit stetiger Verteilungsfunktion und ich nehme konkret gleich verteilte Zufallsvariablen auf 0,1. Das können wir dann entweder vorne, also dann können wir, also das ist dann zum Teil tabelliert oder wir können es eben durch Simulation mit einer festen Verteilung erzeugen.
Also im Prinzip können wir die Prüfgröße sonst auch schon durch Simulation erzeugen, auch wenn hier, wenn wir hier dann jedes Mal eben diese konkrete Verteilungsfunktion mit berücksichtigen, wir müssten bei der Simulation, das ist kein großes Problem. Die Simulation wird ein bisschen einfacher, wenn ich eben mit gleich verteilten Zufallsvariablen rechne, statt mit einer
beliebigen Verteilungsfunktion, bringt aber nicht arg viel, aber der Witz ist eben, die anderen Werte kann ich tabellieren. Das heißt, ich kann für einen stellfesten Stichprobenumfang das tabellieren für alle möglichen, für Tests, für alle möglichen stetigen Verteilungsfunktionen. Also bei stetigem F0 möglich, damit bei stetigem F0 möglich.
Wähle für C oder wähle C als Alpha-Fraktil der Zufallsvariable.
Ups, wähle C als Alpha-Fraktil, das habe ich auch gleich Qn-Alpha genannt, Zeichnung eingeführt, Supremum
T aus R, jetzt setze ich eben für die x1 bis xn speziell gleich verteilte Zufallsvariablen ein. Also 1 gleich n, also i gleich 1 bis n, Indikatorfunktion zum Intervall von Minus und Endlich bis T, von ui.
Dann ziehe ich ab die Verteilungsfunktion von dieser Gleichverteilung und die Verteilungsfunktion ist gleich T, wenn T zwischen 0 und 1 liegt und wenn T nicht zwischen 0 und 1 liegt, interessiert mich das Ganze eigentlich nicht, weil wenn T gleich 0 oder T gleich 1 ist, dann wird dieses Supremum hier, dieser Wert hier gleich 0 sein.
Oder ich muss so sagen, wenn T kleiner als 0 ist, wird das beides gleich 0 sein, also Fn von T minus F von T und wenn T größer als 1 ist, wird das auch beides, wird der hier gleich 1 sein, der hier auch, kann ich also beides abziehen.
U1 bis Un sind unabhängig auf 0,1 gleich verteilt. Und der Witz ist jetzt eben, das kann ich vertafeln.
Also in Abhängigkeit vom Stichprobenumfang ist das Ding dann zum Teil vertafelt.
Unser Test sieht dann so aus, bei Stetigen F0 lehnen wir eben H0 F gleich F0 ab, falls dieses Supremum hier, also jetzt Fn von T minus F0 von T, Fn von T ist unsere konkrete empirische Verteilungsfunktion zu den Daten, die wir haben, falls das größer als unsere Q in Alpha ist.
Also Teste bei Stetigen F0, H0 F gleich F0 versus H1 F ungleich F0 mittels V von x1 bis xn ist gleich 1,
falls das Supremum T aus R, Fn von T minus F von T, größer als das Q in Alpha ist und 0 sonst.
Nochmal der Witz an der ganzen Sache ist, also den gleichen Test könnte ich im Prinzip schon vorher machen, nur da müsste ich eben hier jetzt, das kann ich ja immer durch Simulationen, ich kann versuchen, es durch Simulationen zu erzeugen. Ich müsste dann eben für jedes einzelne F0 eine separate Simulation machen.
Also es hätte keinen Sinn, das irgendwie zu vertafeln, weil da müsste ich es auch noch in Abhängigkeit von F0 zu vertafeln. Während so kann ich jetzt die Werte im Prinzip durch eine Simulation mit einer gleichverteilten Zufallsvariable erzeugen, da stimmt eben dieses Supremum mit dem Wert hier überein.
Also ich kann mich nur auf das Intervall von 0,1 zurückziehen und dann kann ich das Ding im Prinzip auch noch vertafeln. Okay, haben Sie Fragen soweit?
Keine Fragen, dann machen wir Beweis von Satz 8,1.
Also im Prinzip, wenn man sich den Beweis merken müsste, wollte, den auswendig hinzuschreiben, müsste man nicht mit dem letzten Schritt anfangen. Dann wird man sehen, was man im ersten und zweiten Schritt braucht. Das heißt, ich müsste nochmal das Supremum T aus R, ja ich schreibe es mal kurz hin. Also wir gucken mal Supremum T aus R an, Fn von T und der Trick wird sein, dass wir zeigen, das
hier ist das Gleiche wie die Indikatorfunktion zum Intervall von Minus und Endlich bis F von T und F von Xi. Das heißt, wir werden im zweiten Schritt des Beweises zeigen, dass T kleiner gleich Xi mit Wahrscheinlichkeit 1 das Gleiche ist wie F von T.
Wir werden im zweiten Schritt des Beweises zeigen, dass Xi kleiner gleich T mit Wahrscheinlichkeit 1 das Gleiche ist wie F von Xi kleiner gleich F von T.
Die eine Richtung ist klar, wenn Xi kleiner gleich T ist, ist aufgrund der Monotonie auch F von Xi kleiner gleich F von T, F ist ja monoton wachsend, nur die Rückrichtung macht uns eben Probleme und das gilt eben bei stetigem F0. Und dann werden wir ausnutzen, dass wir im ersten Schritt des Beweises gezeigt haben, dieses F von Xi ist eine auf 0,1 gleichverteilte Zufallsvariable.
Was soll der erste Schritt sein? Und dann sehen Sie, dann läuft hier drin eigentlich, in dem Supremum läuft eigentlich F von T, das ersetze ich dann durch ein U und dann habe ich, bekomme ich im Prinzip auf den Ausdruck hier mit T ersetzt durch U.
Okay, all das ist die Beweisidee und jetzt machen wir einen eigentlichen Beweis. Erster Schritt, wir zeigen, ist X eine reelle Zufallsvariable mit stetiger Verteilungsfunktion F, so ist F von X auf 0,1 gleich verteilt.
Dazu hilfreich ist die Betrachtung der verallgemeinerten Inversen zu F, die kennen
Sie schon aus dem Beweis des Darstellungsatzes von Scorocot aus der Wahrscheinlichkeitstheorie. Für T aus offenen Intervall von 0 bis 1, ich setze F oben minus 1 von T, das ist
die kleinste Stelle, wo F von X noch größer gleich T ist, vielleicht ein Infimum über X aus R.
Es macht Sinn, wenn Sie sich überlegen, dieses F ist ja monoton, ich will dann so eine verallgemeinerte Inverse bilden, ich suche eigentlich eine Stelle, wo F von X gleich T ist, die habe ich aber eventuell nicht, hier hätte
ich sie, weil F war stetig, aber im Allgemeinen könnte man es auch für nicht stetige Verteilungsfunktionen definieren und dann gucke ich mir halt alle Stellen an, wo F von X größer gleich T ist und nehme die kleinste davon.
Ok, Sie können sich überlegen, ist das Ding wohl definiert? Ja, nein, wir können uns überlegen, die Menge, die hier steht, ist nicht leer, warum? Sie haben T ist echt kleiner als 1, nach Voraussetzung, F von X konvergiert gegen 1, für X gegen endlich, die Menge ist nicht leer, Sie können sich weiter überlegen, die Menge ist nach unten beschränkt, warum?
T ist echt größer als 0, nach Voraussetzung, F von X konvergiert gegen 0, für X gegen endlich, das heißt irgendwann sind die alle kleiner als T. Und Sie können sich drittens überlegen, ich hätte eigentlich nicht Infimum, sondern Minimum schreiben können, und eigentlich schreibt man das
normalerweise auch, also wir machen mal Minimum, X Element R, F von X größer gleich T, das ist die eigentliche Definition. Und das gilt, weil die Verteilungsfunktion, naja hier ist es stetig, aber
in aller Regel ist es zumindest rechtzeitig stetig, deswegen wird dieses Infimum angenommen. Über dieses F o-1 von T kann ich die folgenden beiden Aussagen machen, dann gilt, die erste Aussage, die ich behaupte,
ist, dass F von F o-1 von T gleich T ist, alle T aus 0,1, kann das jemand von Ihnen begründen?
Es geht einfach, wenn Sie sich überlegen, wir beweisen zwei Großagleichbeziehungen, wir zeigen erstens F von F o-1 von T ist größer gleich T, und wir zeigen zweitens F von F o-1 von T ist kleiner gleich T, wie sieht es mit dem Großagleich aus?
Das Großagleich geht direkt über die Definition, ist richtig, wir haben hier die Menge à la X, wo F von X größer gleich T ist, wir nehmen das Minimum davon, das heißt, wenn das F o-1 von T ist da drin, dann muss F von F o-1 von T größer gleich T sein.
Also, wir haben F von F o-1 von T größer gleich T, da F o-1 von T eben in dieser Menge à la X ist, zweitens, warum ist F von F o-1 von T auch kleiner gleich T?
Machen Sie indirekt, also machen wir angenommen, unser F von F o-1 von T wäre echt kleiner als T, wo kriegen Sie da einen Widerspruch her?
Okay, Sie wollen es ausschreiben, weil T ist was für Sie? Es wäre das Wahrscheinlichkeitsmaß von 0 bis T, wenn unsere Zufallswariabel auf 0,1
gleich verteilt sind, haben wir aber nicht vorausgesetzt, wir haben ja noch eine allgemeine Verteilung. Ja, gut, ich zeige das gleiche wie in der Zeit der Trüger, okay, aber es geht doch eigentlich auch ganz gut, oder?
Angenommenes wäre kleiner, dann hätten wir einen Widerspruch zur Zeit der Trüger, es bringt nur den Beweis nicht so ganz voran, aber gut, so ist es halt.
Also, wir zeigen mal, angenommenes wäre größer, aber macht das die Frage einfacher.
Also, Sie wollen darauf hinaus, dass T das Maß von 0 bis T ist, ja, aber wie bekommen Sie jetzt irgendeine Aussage und dann hat eine stetige Verteilung, ja?
Ja, an dieser Stelle steht Px von 0 bis F o-1t, F o-1 ist das Minimum,
sodass Fx größer gleich T ist, und das heißt, ja, aber eben macht vielleicht auch die andere Beziehung, ne?
Okay, Sie sagen jetzt, wir haben jetzt hier ein F von F oben, eine Stelle, wo es größer als T ist, wo bekommen Sie die Stelle her, die kleiner als T ist? Sie bekommen die kleine Stelle kleiner als T ist, weil, ne, aber ich meine, da bräuchte ich die Annahme überhaupt nicht, ne?
Also, ich meine, Sie haben immer eine Stelle, die größer ist, Sie haben immer eine Stelle, die kleiner ist, weil F von x gegen 1 kontergiert, F von x kontergiert gegen Minus 1, und dann finden Sie eine Stelle, wo F von x gleich T ist, und dann sagen Sie, das muss eigentlich
das sein, weil es die minimale Stelle ist, oder vielleicht darf ich mal versuchen, ich versuche vielleicht doch mal selber,
also angenommen, das ist größer als T, dann ist es in der ganzen Umgebung noch größer als T, dann gehe ich ein bisschen links davon, ziehe ein kleines Epsilon ab, es ist immer noch größer als T, dann ist es, das bisschen links davon ist auch noch drin, dann wäre F oben minus 1 von T minus Epsilon immer noch in der Menge drin, aber F oben minus 1 von T soll das Minimum sein.
Also, weil F stetig ist, stetig existiert ein Epsilon größer 0, sodass F von, F oben minus 1 von T minus Epsilon auch noch größer als T ist, und daraus folgt eben dieses F oben minus 1 von T minus Epsilon, wäre in der
Menge von da oben drin, und wenn ich jetzt die Definition von F oben minus 1 nehme,
wäre dann aber F oben minus 1 von T kleiner gleich als jede Zahl, die da drin liegt in der Menge, also kleiner gleich als F oben minus 1 von T minus Epsilon, was ein Widerspruch wäre,
halt darauf wollte ich eigentlich hinaus.
Gut, dann der zweite Teil, der zweite Teil ist sowas, mich interessiere mich für, wir machen vielleicht mal einen T kleiner gleich F von X,
und wenn Sie sich vorstellen, Sie hätten eine richtige Inverse, F oben minus 1, und F ist monoton, dann ist die Inverse auch monoton,
dann wäre F oben minus 1 von T kleiner gleich als F von F oben minus 1 von F von X, also F oben minus 1 von T wäre kleiner gleich X, und umgekehrt könnten Sie es auch schließen, weil F ist ja monoton, dann haben Sie die Beziehung.
Und ich behaupte, das gilt jetzt, ohne dass ich weiß, dass überhaupt eine wirkliche Inverse existiert. Ok, Sie können mal drüber nachdenken, ich wische schon lange ein bisschen Tafel, jetzt machen wir jetzt für das zweite eine Begründung,
denn die eine Beziehung ist ganz einfach, nämlich die von rechts nach links, die gilt, weil Sie haben F von minus 1 von T kleiner gleich X,
weil F monoton ist es dann auch, ok ich schreibe schnell hin, F oben minus 1 von T kleiner gleich X,
F ist monoton wachsend, dann ist auch F von F oben minus 1 von T kleiner gleich F von X,
und nach dem ersten, was wir gerade eben gezeigt haben, ist F von F oben minus 1 von T gleich T. Und das war die eine Beziehung. Die umgekehrte Beziehung, wenn T kleiner gleich F von X ist, warum ist dann F oben minus 1 von T kleiner gleich X?
Genau, das ist unmittelbar die Definition, das F oben minus 1 von T ist ja das kleinste X mit der Eigenschaft, dass T kleiner gleich F von X ist.
Das heißt, wenn ich weiß, dass T kleiner gleich F von X ist, dann kann ich daraus folgern, dass dieses X in dieser Menge aller, ja X ist eben in dieser Menge aller, ich nenne es vielleicht mal Minimum aller U aus R, F und U großer gleich T drin,
und dann ist aber F oben minus 1 von X als Minimum aller dieser Elemente, ist dann sicher kleiner gleich als X.
Und das mal zu zeigen. Ok, damit folgt die Aussage, die wir eigentlich machen wollen, wie folgt. Ich gucke mir jetzt die Wahrscheinlichkeit an, dass, naja, ich könnte mir die Verteilungsfunktion angucken,
F von X kleiner gleich T, aber im Hinblick auf die Beziehung 2 ist es vielleicht einfacher, ich starte mit T kleiner gleich F von X. Also damit gilt für T aus dem offenen Intervall von 0 bis 1 die Wahrscheinlichkeit, dass T kleiner gleich F von X ist.
Das kann ich nach 2 umschreiben, zur Wahrscheinlichkeit, dass F oben minus 1 von T kleiner gleich X ist.
Das heißt, hier steht, wenn ich es andersrum hinschreibe, X ist, ja ok, ich gehe zum Komplement noch über,
1 minus Wahrscheinlichkeit, dass, also hier steht jetzt X größer gleich, dann ist die Komplementär-Mahrscheinlichkeit, dass X kleiner als F oben minus 1 von T ist.
Da F die Verteilungsfunktion stetig ist, ist es gleich die, also F stetig, 1 minus Wahrscheinlichkeit, dass X kleiner gleich F oben minus 1 von T ist.
Und das ist jetzt nach Definition von F, F ist ja die Verteilungsfunktion von X, also hier steht ja die Verteilungsfunktion von X an der Stelle F oben minus 1 von T,
das ist dann 1 eben 1 minus F von F oben minus 1 von T und F von F oben minus 1 von T war nach 1 gleich T.
Ok, sieht jemand, wie daraus die Behauptung folgt?
Das selbe Ergebnis bekommen wir für eine Gleichverteilung, ist richtig, also wenn F von X eine Gleichverteilung ist, habe ich für T aus 0,1 und dann sagen sie,
diese Intervalle von Minus nennlich bis T, naja gut, ich kann mir noch weiter überlegen, das ist ja 1 minus die Verteilungsfunktion der Gleichverteilung und es gilt natürlich auch für die Verteilungsfunktion der Gleichverteilung,
wenn das T kleiner als 0 ist oder größer als 1 ist. Ich kann mir noch überlegen, was ist mit 0 und 1, auch für 0 und 1, da habe ich ja, also für 0 hätte ich hier, na gut, für 0 und 1 folgt es dann mit der rechtzeitigen Stätigkeit und dann nehmen wir den Erzeuger,
ist richtig, aber ist irgendwie kein schöner Beweis. Ich habe irgendwie den Starteneindruck, so wollte ich ihn nicht führen, doch so wollte ich ihn führen, F von X größer gleich U,
ja gut, ich wollte eigentlich letzten Endes,
okay, wir haben das, also wir wissen, ich wollte letztendlich die rechtzeitige, also letztendlich würde ich es gerne umschreiben zur Verteilungsfunktion,
also ich komme ja jetzt auf die Wahrscheinlichkeit, dass F von X kleiner als T ist, also mich interessiert eigentlich die Wahrscheinlichkeit, dass es kleiner als T ist. Ich habe die für kleiner als T ist 1 minus T und dann nehme ich die
rechtzeitigen Grenzwerte. Okay, also überlegen wir nochmal, also wir haben jetzt für alle T aus 0 und 1, haben wir die Wahrscheinlichkeit, dass vom Komplement, dass F von X kleiner als T
ist, ist gleich 1 minus T und ich würde gerne daraus schließen, dass auch die Wahrscheinlichkeit, dass F von X kleiner als T ist, ist gleich T, Entschuldigung, Sie haben vollständig recht
und ich würde gerne daraus schließen, dass für alle T aus 0 und 1, auch die Wahrscheinlichkeit, dass F von X kleiner als T ist, sieht das jemand? Haben Sie eine Frage? Bei F stetig habe ich hier schon benutzt,
dass ich ein kleiner, ein kleiner Gleich verwandeln kann, aber ich weiß ja noch nicht, dass F von X auch stetig ist, die Verteilungsfunktion, aber nicht, dass die Verteilungsfunktion von F von X stetig ist. Das habe ich gerade noch nicht benutzt und das möchte ich auch nicht benutzen,
aber ich behaupte eigentlich, aus dem können Sie das folgen. Sehen Sie das? Wie können Sie denn diese Wahrscheinlichkeiten mit diesen Wahrscheinlichkeiten ausdrücken?
Wenn Sie sich mal überlegen. Einfach einen Grenzwert nehmen. Das heißt, wir können den Grenzwert, also wir machen das mit einem S. F von X ist kleiner als S gleich S und wir lassen dann S von rechts gegen T gehen. Dann konvergiert das gegen das und das konvergiert gegen das.
Das ist die rechtsschaltige Stetigkeit der Verteilungsfunktion. Jetzt kann ich aber
die Verteilungsfunktion insgesamt ausrechnen. Also wenn ich für alle T aus R mir angucke, was ist die Wahrscheinlichkeit, dass F von X kleiner als T ist und ich behaupte,
dass 1 T 0, 1 für T größer als 1 zwischen 0 und 1 ist T und 0 für T kleiner als 0. Wie sehen Sie das? Naja, wenn das T größer als 1 ist, ist es klar, dann ist das Ding
gleich, weil F ist ja eine Verteilungsfunktion, hat Wertebereich von 0 bis 1, dann ist das immer erfüllt, dann ist die Wahrscheinlichkeit gleich 1. Genauso sehen Sie, wenn das T kleiner als 0 ist, F von X ist größer als 0, das Ereignis wird nie eintreten, die Wahrscheinlichkeit ist gleich 0. Dann haben Sie hier noch für T echt zwischen 0 und 1 gilt es auch und dann nehmen
Sie die rechtsschaltige Stetigkeit von der Verteilungsfunktion und von der Funktion, die da steht, dann haben Sie es. Okay, und damit haben wir es jetzt. Daraus folgt unser F von X
gleich verteilt auf O01. Okay, Fragen soweit? Gut, dann machen wir fünf Minuten Pause zum
Tafelwischen und ich mache dann um 10 Uhr 42 weiter. Ja, würde ich ganz gern weitermachen.
Kommen wir zum zweiten Schritt. Im zweiten Schritt zeige ich mit Wahrscheinlichkeit 1 gilt, X1 ist kleiner als T, genau dann, wenn F von X1 kleiner als F und T ist. Zweiter Schritt,
wir zeigen, mit Wahrscheinlichkeit 1 gilt, X1 ist kleiner als T, genau dann, wenn F von X1 kleiner als F und T ist.
Ganz egal, was I ist, irgendwas zwischen 1 und N. Dazu, wir gucken uns erst mal das Ereignis an,
dass X1 kleiner als T ist. Da F monoton ist, impliziert X1 kleiner als T immer F von X1 kleiner als F und T.
Das heißt, dieses Ereignis hier ist enthalten im Ereignis, dass F von X1 kleiner als F und T ist.
Und jetzt zeige ich noch, dass die Wahrscheinlichkeit von den beiden Ereignissen gleich groß ist. Dann ist die Wahrscheinlichkeit von der rechten Seite, mengentheoretische Differenz zur linken Seite, gleich Null und wir sind fertig.
Also weiter gilt die Wahrscheinlichkeit, dass X1 kleiner als T ist, es war ja gerade F von T, das ist die Definition von F. Nach der Zeile, die drüber steht, ist es kleiner als der
Wahrscheinlichkeit, dass F von X1 kleiner als F und T ist. Ja, und jetzt haben wir Schritt 1. Schritt 1 haben wir gezeigt, dass F von X1 auf Null und eins gleich verteilt sind,
gleich verteilt ist. Das heißt, die Wahrscheinlichkeit, dass diese gleich verteilte Zufallswariable kleiner als der Zahl F von T ist, Zahl zwischen Null und eins, ist gerade diese Zahl, also gerade F von T. Dann sehen Sie, die linke Seite ist kleiner
als der, oder links und rechts steht das Gleiche dazwischen, eine kleiner Gleichbeziehung. Das heißt, diese kleiner Gleichbeziehung ist in Wahrheit ein Gleichheitszeichen.
Das heißt, diese beiden Mengen sind gleich groß. Das heißt, wir haben bereits gezeigt, erstens, ich kann das von oben noch mal hinschreiben, und die Wahrscheinlichkeiten
sind gleich groß. Dann haben Sie zwei Mengen, A und B. A ist eine Teilmenge von B,
die Wahrscheinlichkeiten sind gleich. Dann stimmen die beiden Mengen überein, bis auf die Mengendifferenz. B ohne A, weil A ja eine Teilmenge von B ist. Die Wahrscheinlichkeit von B ohne A ist die Wahrscheinlichkeit von B minus Wahrscheinlichkeit von A, wenn A eine Teilmenge von B ist, und die Wahrscheinlichkeiten sind gleich groß,
also die Wahrscheinlichkeit von B ohne A ist Null. Das heißt, die beiden Mengen stimmen bis auf mit Wahrscheinlichkeit eins überein. Also ich mache einfach mal Behauptungen. Wir sind fertig. Ja, dann können wir jetzt den Beweis fertig machen. Dritter Schritt.
Wir zeigen die Behauptung des Satzes und benutzen eben, dass mit Wahrscheinlichkeit
eins gilt. Ich schreibe die Größe der Verteilung, mich interessiert hin,
Supremum T aus R. Nach Definition ist es das Gleiche. Und ich kann eben jetzt das machen,
was ich ganz zu Beginn des Beweises angekündigt habe, was wir machen. Wir wissen jetzt, Xi kleiner gleich T ist mit Wahrscheinlichkeit eins das Gleiche wie F und Xi kleiner gleich F und T. Und damit ist die Indikatorfunktion zum halboffenen Intervall von Minus nennendlich bis T von Xi mit Wahrscheinlichkeit eins das Gleiche wie die Indikatorfunktion zum
halboffenen Intervall von Minus nennendlich bis F und T von F und Xi. Also Schritt zwei.
Ja, im Prinzip bin ich jetzt eigentlich schon fertig. Weil die Verteilung von dem, was da steht, hängt jetzt nur noch von der Verteilung von F von X1 bis F von Xn ab.
Und die sind unabhängig identisch verteilt. Und jede einzelne Komponente ist nach Schritt eins auf null eins gleich verteilt. Das heißt, die Verteilung hat nichts mehr zu tun mit dem ursprünglichen. Ja doch, da steht noch das ursprüngliche F drin. Also mache ich es
vielleicht doch nicht. Sondern wir schmeißen noch das ursprüngliche F raus. Also hier läuft gerade an zwei Stellen das F und T. Also eigentlich läuft, haben wir T als Laufvariable, aber wir verwenden T gar nicht, sondern wir nennen immer nur F und T. F und T durchläuft das Intervall von null bis eins. Und ich behaupte, was hier steht, ist das gleiche wie das Supremum
über U aus R. Von dem gleichen Ausdruck, wenn ich F und T durch U ersetze. Ja, und ich mach
vielleicht nicht U aus R, sondern ich mach U aus null eins. Also ich schreibe U anstelle von F und T.
Da muss ich jetzt ein bisschen aufpassen, weil dieses F und T, T aus R, nicht unbedingt das gleiche sein muss wie das Intervall von null bis eins. Ich weiß aber, also lassen sie hier
mal ein bisschen Platz. Ich weiß auf alle Fälle, dass F und T, T aus R, die Teilmenge von null eins ist.
Ich weiß noch nicht, ob das ganze Intervall drin liegt. Ich weiß aber, dass beliebig Zahlen beliebig nahe an der Null, die größer als die Null sind, drin liegen. Ich weiß, dass Zahlen beliebig nahe an der eins, die kleiner sind als eins, drin liegen. Und ich weiß, dass F stetig sind, also auch noch alle Zahlen dazwischen. Damit liegt das ganze offene Intervall von null bis eins auch drin.
Das heißt, das ist zumindest drin. Und ich muss mir jetzt nur überlegen, falls es jetzt zufälligerweise eben die Null oder die Eins nicht dran drin liegen würde, ändert das, was an meiner Größe, die da oben steht, oder an dieser Größe. Hier ändert sich das Supremum, wenn ich die
Null oder die Eins rausstreichle. Das heißt, kann der Supremumswert eigentlich bei der Null oder bei der Eins auftauchen? Naja, Sie machen sich klar, wenn das Ganze eine Eins ist, dann sind natürlich alle f von x i kleiner als eins. Das heißt, dieser arithmetische Mittel hier ist eins,
ich ziehe eins ab, gibt Null. Die ganzen anderen Werte sind größer als Null, kann es nicht sein. Wenn das Ganze eine Null ist, naja, ich weiß f von x i ist eine Gleichverteilung auf dem Intervall von null bis eins. Das heißt, der Wert Null wird nur mit Wahrscheinlichkeit null angenommen. Das heißt, auch den kann ich eigentlich genauso gut weglassen, dann sind die hier alle
gleich Null mit Wahrscheinlichkeit eins, dass es auch Null gibt, auch die Null. Das heißt, die Null oder Eins selber stört mich nicht. Und hier habe ich noch f stetig ausgenutzt. Jetzt sehen Sie,
diese Größe, die mich interessiert, stimmt mit Wahrscheinlichkeit eins mit einer anderen Größe überein. Damit hat auch die Größe, die mich interessiert, die gleiche Verteilung wie die andere Größe. Die Umkehrung wäre übrigens nicht richtig, also wenn die gleiche Verteilung ist,
dann muss ich nicht mit Wahrscheinlichkeit übereinstimmen. Eins übereinstimmen, aber okay, wir gehen in die Richtung, also hat die gleiche Verteilung, hat die gleiche Verteilung wie das da und nach Schritt eins war das, hängt aber die Verteilung, die hier steht, nicht mehr von f ab.
Also nach Schritt eins ist f von x i auf Null eins gleich verteilt und daraus folgt eben die
Verteilung der Zufallsvariabeln oben, hängt nicht von f ab. Haben Sie Fragen soweit? Also Sie sehen,
der Beweis war eigentlich relativ einfach. Also wenn man sich das merkt, man muss sich eben nur merken, man kann das x i kleiner gleich t umschreiben zu f von x i kleiner gleich f von t. Man muss ja eben noch wissen, wenn x der stetige Verteilungsfunktion f hat, dann ist f von x auf
Null eins gleich verteilt. Aber der Beweis, die beiden Beweise waren halt schon ein bisschen schreckreich. Gut, dann wären wir fertig mit dem Beweis. Die zweite Sache, um diesen kritischen
Wert zu bestimmen, ist eine asymptotische Verteilungsaussage über diese Prüfgröße da oben zu verwenden. Da zitiere ich jetzt einen Satz ohne Beweis. Das ist der Satz 8.2.
Sind x 1 bis x N unabhängig identisch verteilte reelle Zufallsvariabeln mit stetiger
Verteilungsfunktion f und ist f N die zu x 1 bis x N gehörende empirische Verteilungsfunktion, so kann ich eben angeben, eine Zufallsvariable angeben gegen die Wurzel N mal Supremum t aus R betracht von f N von t minus f von t nach Verteilung konvergiert.
sind x1 bis xn unabhängig identisch verteilte reale Zufallsvariablen mit stetiger Verteilungsfunktion f und ist f dann die zu x1 bis xn gehörende empirische Verteilungsfunktion. So gilt für jedes
Lambda größer Null. Ich gucke mir die Wahrscheinlichkeit an, dass dieses Supremum
T aus R betragt von fn von T minus f von T kleiner gleich als Lambda durch viertel n ist und will den Liemes für n gegen endlich. Und das gibt einen Grenzwert. Und diesen Grenzwert
kann ich also ich bezeichne mal abstrakt mit Q von Lambda. Also Grenzwert existiert. Kommt eine Funktion Q von Lambda raus und das Q kann ich inschreiben. Wobei Q von Lambda ist eine Reihenentwicklung. 1 minus 2 mal Reihe j gleich 1 bis unendlich. Minus 1 auf j
mal e hoch minus 2 j Quadrat mal Lambda Quadrat. Und das können Sie jetzt umdeuten. Das ist
eigentlich eine Verteilungskonvergenz Aussage. Das heißt, wenn ich die Wurzel n auf die andere Seite bringe, dann konvergiert das ganze Ding eben nach Verteilung gegen eine
Zufallsvariable mit Verteilungsfunktion Q. Und das Ganze machen wir ohne Beweis. Also im
Prinzip, wenn Sie es beweisen wollten, müssen Sie sich eben den ganzen stochastischen Prozess Fn von T minus f von T mit T aus R angucken. Würden dafür eine Verteilungskonvergenz Aussage
in einem geeigneten Funktionraum zeigen und könnten dann anschließend ein Funktional drauf angewendet und könnten dann diese Aussage davon herleiten. Aber die erste
Aussage wäre mehr in der Vorlesung über stochastische Prozesse, was ich hier nicht mache. Okay, Fragen soweit. Dann wäre die Frage, was bringt dieser Satz im Vergleich zu dem, was wir schon haben? Also was hilft uns bei unserem Testproblem? Teste H0, F gleich F0
versus H1, F ungleich F0. Oder ich wüsste mal, Sie denken drüber nach. Okay, Vorschläge. Kann
ich das jetzt auch irgendwie zum Testen verwenden? Und wo ist der Vorteil? Weil wir schon testen. Also bisher musste ich für jedes N nachschauen oder wenn ich das tabellieren wollte,
dann müsste ich für jeden Stichprobenumfang eigentlich separat diese alpha-fraktile Qn alpha tabellieren. Während jetzt kann ich sagen, okay, mein N ist groß. Ich nehme einfach die asymptotische Verteilung und nehme davon das alpha-fraktil. Das heißt, ich habe weniger zum
tabellieren. Im Hinblick darauf, dass ich das im Prinzip einfach am Rechner simulieren kann, bringt es mir nichts. Aber es ist natürlich zur Anwendbarkeit des Testes, wenn Sie keinen Rechner zur Verfügung haben oder wenn Sie kein Programm schreiben wollen, ist es natürlich deutlich einfacher, wenn Sie einfach einen Fraktil irgendwo nachschlagen können. Genau. Okay, schreibe ich noch hin. Das ganze Anwendung dieses Satzes ergibt den sogenannten Test von
Kolmogorov-Smyrnov. Nehle eben H0, F gleich F0 zum Niveau alpha aus 0, 1 ab. Falls
gilt, dieses Supremum T aus R ist größer als ein Lambda alpha durch Wurzel N, wobei eben 1 minus Q von Lambda alpha gleich alpha ist. Also lehne H0, F gleich F0 zum
Niveau alpha aus 0, 1 ab, falls gilt Supremum T aus R. Betrag von Fn von T minus F von T
ist größer als Lambda alpha durch Wurzel N, wobei eben dieses Lambda alpha aus R plus
gilt mit 1 minus Q von Lambda alpha ist gleich alpha. Und der Witz ist jetzt eben, die Werte von Lambda alpha sind tabelliert und ich kann sie Ihnen hier auch direkt angeben,
bei Alpha gleich 0,05 kommt 1,36 raus, bei 0,01 kommt 1,63 raus. Werte von Lambda alpha sind tabelliert. Okay, haben Sie Fragen soweit? Also wir sind mal wieder so 13 Minuten vor
Ende der Vorlesung und ich könnte jetzt das neue Kapitel anfangen und beim nächsten Mal genau das Ganze, was ich jetzt hinschreibe, wieder hinschreiben, was irgendwie nicht ganz effizient ist. Ich zeige Ihnen stattdessen noch die entsprechenden zwei Prüfungsfragen, die wir heute behandelt haben und wir hören dann ein paar Minuten früher auf. Das ist
irgendwie effizienter. Okay, Frage Nummer 45. Welche Aussagen, Aussagen über die
Verteilung von Supremum T aus R, Betrag von Fn von T minus F von T mit Fn gleich empirische
Verteilungsfunktion für festes N, kennen Sie? War genau die Aussage von gerade eben, wenn F eben stetig ist, dann hängt die Verteilung von dieser Prüfgröße da oben nicht von der von F ab. Und wie konstruiert man daraus einen Test für H0, F gleich F0 versus H1 F
ungleich F0? Na ja, da muss man jetzt eben mit einer Computersimulation sich die Fraktile von dieser Prüfgröße besorgen. Im Prinzip, was Sie auch wissen sollten, eigentlich bräuchte ich die Aussage gar nicht. Ich könnte schon vorher mit einer Computersimulation die Fraktile bestimmen. Ich könnte einfach mit F0 simulieren. Nur müsste
ich dann eben in komplizierteren Zufallszahlen Generator verwenden bzw. anders kann sein, dass die Größen sogar schon tabelliert sind. Und dann ist zweite Frage Nummer 46. Erläutern Sie den Test von Kolmogorov-Smyrnov. Sie müssten eben diesen Satz sagen,
dass dieses Wurzel aus N mal Supremum von FN von T minus F von T nach Verteilung gegen eine Zufallsvariable konfigiert, deren Verteilungsfunktion Q man kennt. Die Verteilungsfunktion müssten Sie nicht hinschreiben können, klar. Die Formel müssen Sie nicht auswendig wissen. Und dann, dass man eben dann sagt, ja, dann nimmt man
das Alpha-Fraktil von dieser Verteilung und lehnt ab, falls die Prüfgröße größer als dieses Alpha-Fraktil ist. Okay, haben Sie noch Fragen soweit? Wie sieht die Verteilung
von Q Alpha aus, wenn man splattet? Keine Ahnung. Ich habe es auch noch selber noch nie gemacht. Also da bin ich jetzt gerade nicht. Wir haben eine Reihe und wir können uns
natürlich nichts drunter vorstellen. Was ist so ein e hoch minus zwei mal j Quadrat mal Lambda Quadrat? Keine Ahnung, wo das herkommt. Muss ich passen. Ich könnte nicht mal sagen,
ob es schnell gegen Null geht oder langsam gegen Null geht, weil es ja noch ein minus eins hoch j minus eins davor. Okay, noch weitere Fragen, die ich fundiert beantworten kann. Dann kann ich noch mal darauf hinweisen, wir sind am Donnerstag in dem Nachbarhörsaal.
Also wir mussten aus dem A01 raus und gehen in den A02. Okay, gut, dann war es das für heute.