We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Der x^2-Anpassungstest - Teil 2

00:00

Formal Metadata

Title
Der x^2-Anpassungstest - Teil 2
Title of Series
Part Number
24
Number of Parts
28
Author
License
CC Attribution - NonCommercial - ShareAlike 3.0 Germany:
You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal and non-commercial purpose as long as the work is attributed to the author in the manner specified by the author or licensor and the work or content is shared also in adapted form only under the conditions of this
Identifiers
Publisher
Release Date
Language

Content Metadata

Subject Area
Genre
Abstract
Aufgabe der Statistik ist es, Rückschlüsse aus Beobachtungen zu ziehen, die unter dem Einfluss des Zufalls enstanden sind. Diese Vorlesung gibt eine umfassende Einführung in die zugehörige mathematische Theorie. Behandelt werden u.a.: Hauptsatz der Mathematischen Statistik, Dichteschätzung, nichtparametrische Regressionsschätzung, Punktschätzverfahren, statistische Tests, Bereichsschätzverfahren.
Charakteristische FunktionLogarithmSummationPower seriesTerm (mathematics)Mathematical statisticsMathematische FakultätZufallsvektorSquareVector graphicsMatrix (mathematics)Degrees of freedom (physics and chemistry)ExponentiationRandom variableTestgrößeSet (mathematics)Partition (number theory)Derived set (mathematics)Series (mathematics)Cumulative distribution functionTaylor seriesEuclidean vectorExpected valueFunction (mathematics)Probability distributionContinuous functionPotenz <Mathematik>Computer animationLecture/Conference
LogarithmSquareFactorizationAdditionDerived set (mathematics)Maxima and minimaGeometric seriesSummationParameter (computer programming)Power seriesPotenzreihenentwicklungTerm (mathematics)Series expansionTaylor seriesAbsolute valueLecture/Conference
SquareMatrix (mathematics)Random variableLogarithmCharakteristische FunktionS-MatrixSummationLimit (category theory)Term (mathematics)Lecture/Conference
Charakteristische FunktionMatrix (mathematics)ZufallsvektorVector graphicsExpected valueDot productLengthSummationSquareContinuous functionComplete metric spaceLecture/ConferenceMeeting/Interview
SquareSummationLengthExpected valueCharakteristische FunktionMatrix (mathematics)Vector graphicsDot productParameter (computer programming)Dimension 1Zusammenhang <Mathematik>ExponentiationNormal distributionPropositional formulaContinuous functionLecture/Conference
BerechnungSample (statistics)Adaptive behaviorSquareStatistical hypothesis testingSocial classDegrees of freedom (physics and chemistry)Maximum (disambiguation)Process (computing)NullAgreeablenessParameter (computer programming)Chi-Quadrat-TestSubsetEstimatorNormal distributionCumulative distribution functionMaximum likelihoodAxiom of choicePhysical quantitySampling (statistics)TestgrößeSequenceProbability distributionPolymorphism (materials science)Lecture/Conference
Total S.A.PositionBinomial distributionPhysical quantityIntegerEstimationTable (information)MetreDegrees of freedom (physics and chemistry)Partition of a set3 (number)Set (mathematics)6 (number)Parameter (computer programming)Chi-squared distributionMaximum likelihoodSummationTestgrößeLecture/Conference
Precedence diagram methodNumber3 (number)Total S.A.SquareGreatest elementTable (information)Partition of a setWahrscheinlichkeitsmaßNullPartition of a setRoundingSet (mathematics)Function (mathematics)ZahlLecture/Conference
GleichverteilungTotal S.A.RegressionsschätzungSocial classProbability distributionSquareNumberNormal distributionTable (information)SummationSet (mathematics)Natural numberStatistical hypothesis testingEstimationGradientLecture/Conference
Transcript: German(auto-generated)
Ja, begrüße sie alle recht herzlich zur heutigen Vorlesung in der mathematischen Statistik. Noch mal der Hinweis vom letzten Mal, die Vorlesung diesen Donnerstag entfällt wegen Begehung des Fachbereichs Mathematik im Rahmen der Reakretisierung der Studiengänge.
Also nächste Vorlesung nach heute ist dann erst Montag in einer Woche. Wir waren gerade stecken geblieben beim Chi-Quadrat-Anpassungstest. Wir haben unabhängig identisch verteilte reelle Zufallsvariablen x1 bis xn mit Verteilungsfunktion f.
f0 ist eine weitere gegebene Verteilungsfunktion. Eigentlich wollen wir testen h0, f gleich f0 versus h1, f ungleich f0. Wir testen stattdessen h0, p1 bis pr gleich p10 bis pr0 versus h1. Diese Vektoren sind ungleich, wobei die Pi0 die Wahrscheinlichkeit ist,
dass bei wahrer Verteilungsfunktion f0 das x1 in einer Menge Ci liegt. Pi ist die entsprechende Wahrscheinlichkeit, wenn f die Verteilungsfunktion ist und c1 bis cr ist eine vorgegebene Partition von r. Dazu setzen wir, yj zählt, wie viele der Xi sind in der Menge Cj.
Das heißt, yj ist Summe i gleich 1 bis n in die Katerfunktion zur Menge Cj von xi für j gleich 1 bis n. Und dann gilt Satz 8.3, die Prüfgröße Tn von x1 bis xn, das ist die Summe j gleich 1 bis r von yj minus seinem Erwartungswert,
das ist n mal pj zum Quadrat, geteilt durch n mal pj, und es konvergiert nach Verteilung gegen eine Xi-Quadrat verteilte Zufallsvariable mit r minus 1 Freiheitsgraden. Wir waren stecken geblieben im Beweis.
Erster Schritt war, wir haben bereits gesehen, es genügt zu zeigen, dass eine orthogonale Matrix A existiert und unabhängige Standardnormal verteilte Zufallsvariablen v1 bis vr minus 1, sodass der Vektor Z1 bis Zr, also die r-dimensionale Zufallsvariable, nach Verteilung gegen A transponiert mal v1 bis vr minus 1 null konvergiert.
Um das zu zeigen, wenden wir den Stetigkeitssatz von Levi-Kramea an. Wir schreiben das Tn als ersten Schritt um, als Summe j gleich 1 bis r Zj zum Quadrat, wobei die Zj gerade yj minus n mal pj durch Wurzel aus n mal pj ist.
Wir haben dann die charakteristische Funktion von dem Z1 bis Zr ausgerechnet. Die charakteristische Funktion an der Stelle u1 bis ur ist ein Phi-Enfu in u1 bis ur. Das ist e hoch minus i mal Summe j gleich 1 bis r uj mal Wurzel n pj durch
Summe j gleich 1 bis r pj mal e hoch i mal den Bruch uj durch Wurzel aus n mal pj und das ganze hoch n. Und was wir jetzt bestimmen möchten, ist, gegen was konvergiert dieses Ding punktweise.
Und da behaupte ich, wenn wir hier n gegen endlich gehen lassen, dann kommt e hoch minus ein halb mal in Klammern Summe j gleich 1 bis r uj Quadrat minus in Klammern Summe j gleich 1 bis r uj mal Wurzel aus pj zum Quadrat heraus. Und von dem werden wir nachher zeigen im letzten Schritt des Beweises.
Das ist die charakteristische Funktion von dem obigen Zufallsvektor A transponiert mal v1 bis vr minus 1 0, wenn wir A geeignet als autogonale Matrix definieren. Okay, ich lasse das mal kurz liegen und fange an.
Ich habe Ihnen schon gesagt, wie es geht. Wir betrachten den Logarithmus von phi n und rechnen damit rum. Also dazu beachten wir, der Logarithmus von phi n von u1 bis ur, wenn wir da einen Logarithmus nehmen,
dann ist es ein Logarithmus vom Produkt, das ist die Summe der Logarithmen.
Der erste Term der Logarithmus gibt gerade einen Exponenten, also minus i mal Summe j gleich 1 bis r uj mal Wurzel n pj.
Das zweite Logarithmus, kann ich ein n herausziehen, gibt also plus n mal den Logarithmus von dem anderen. Von der Summe j gleich 1 bis r pj mal e hoch i mal uj durch Wurzel n mal pj.
Okay, und jetzt lassen wir hier n gegen endlich gehen. Und was ich als erstes mache, ich entwickle diesen Exponentialterm hier innen in der Potenzreihe.
Ganz normale Taylor-Reihe für den ersten Term. Nun gilt, und ich breche ab, wenn ich irgendwas Klein-O von 1 durch n habe.
Also wir haben e hoch i mal uj durch Wurzel n mal pj. Sie wissen, e hoch z ist, wir machen die Taylor-Reihe um 0, also Reihe k gleich 0
bis und endlich k der Ableitung von z an der Stelle 0 durch k Fakultät mal z hoch k. Das heißt, wir fangen an, erster Term ist Funktionswert an der Stelle 0, das wäre 1.
Dann Ableitung von e hoch z an der Stelle 0, also Ableitung ist e hoch z, also ausgehört an der Stelle 0, gibt auch 1, geteilt durch 1 Fakultät bleibt bei 1. Dann kommt also uj durch Wurzel n pj noch dazu.
Dann der quadratische Term, da kommt die Ableitung bis wieder 1 durch 2 Fakultät jetzt, also 1 einhalb. Und das Ganze zum Quadrat, und ich ziehe das n vielleicht gleich schon als, ach so, ich muss es i noch quadrieren, deswegen komme ich auf den Minus.
Minus 1 durch 2 n mal uj zum Quadrat durch pj. Und dann kommen weitere Terme, und da taucht das n mit einer Potenz, also 1 durch n mit einer Potenz größer als 1 auf.
Das heißt, es wären plus o von 1 durch, klein o von 1 durch n. Daraus folgt, was ich da oben habe, diese Summe j gleich 1 bis r, pj mal e hoch i und so weiter.
Das heißt, ich kann in der Summe diese Reihenentwicklung einsetzen. Dann kann ich ausnutzen, dass die pj's sind der Wahrscheinlichkeiten, die zu 1 addieren, also Summe j gleich 1 bis r, pj ist gleich 1.
Das heißt, von der ersten Summe über die pj's mal die 1, komme ich auf 1. Dann von der zweiten Summe, ja, ich kann das 1 durch Wurzel n noch rausziehen, plus Wurzel n.
Und dann multipliziere ich pj mit 1 durch Wurzel aus pj, das heißt, ich komme auf die Summe j gleich 1 bis r, Wurzel pj mal uj. Dann bei dem Minus kann ich das Minus 1 durch 2 n rausziehen, das pj kotzt sich weg, bleibt noch uj zum Quadrat übrig.
Und das o von 1 durch n, endlich oft aufaddiert, bleibt ein klein o von 1 durch n, auch mit den Vorfaktoren davor.
Ja, jetzt habe ich davon einen Logarithmus, der zweite Sommand bekommt noch ein
i, der zweite Sommand bekommt noch ein i hier oben, das ist vollständig richtig. Also ich habe hier eigentlich, ich mache das ja mit, das Argument, das ich einsetze, ist ja ein i mal uj durch Wurzel n pj, dankeschön.
Das heißt, der zweite Sommand hätte hier auch noch ein i, i durch Wurzel aus n. Wenn wir schon dabei sind, ist dem Vielfeld noch ein u, sonst noch ein paar Kleinigkeiten, ich korrigiere doch gerne, das war das, was ich noch abgeschrieben habe, das ist immer ein Fehler, abzuschreiben.
Ok, was ich jetzt mache, ist, ich will hier eine Potenzreihenentwicklung vom Logarithmus einsetzen, die macht man üblicherweise, ja, Logarithmus würden sie nicht unbedingt machen, sondern besser ist,
Logarithmus von 1 plus z zu machen, dann sind die ganzen Ableitungen relativ schön. Das heißt, ich schreibe das Ganze hier als ein 1 plus ein, ich glaube, ich habe es als z n genannt, z n, und dann habe ich einen Logarithmus von 1 durch z n.
Und da mache ich eine Potenzreihenentwicklung, also wir haben jetzt was, wir haben den Logarithmus von 4n von u 1 bis ur, ist gleich minus
i mal, minus i mal Summe j gleich 1 bis r, uj mal Wurzel n pj, plus n mal Logarithmus von 1 durch z n.
Jetzt machen wir die Taylor-Entwicklung von Logarithmus von 1 plus z n, also Taylor
-Entwicklung z wird abgebildet auf Logarithmus von 1 plus z, um Null das Ganze liefert.
Und dann betrachte ich das N mal Logarithmus von 1 durch z n, wir lassen das N mal stehen, ja, die Funktion f von z gleich Logarithmus von 1 plus z, der Funktionswert an der Stelle Null ist Logarithmus von 1, also Null.
Dann Ableitung ist 1 durch 1 plus z, oder 1 plus z hoch minus 1, ausgewertet an der Stelle Null ergibt 1, das heißt, der erste Term wäre 1 mal dann z, also hier 1 plus z n.
Dann die zweite Ableitung, wer die Ableitung von der Funktion z wird abgebildet auf 1 plus z hoch minus 1, das gibt minus 1 mal
1 plus z hoch minus 2, ausgewertet gibt minus 1, ich bekomme also minus 1 durch zwei Fakultät, also minus ein halb, z n Quadrat. Dann dritte Ableitung, ich muss ableiten, minus 1 mal 1 plus z hoch minus 2, da kriege ich jetzt ein Vorfaktor minus
2 noch zu der minus 1, also ein Vorfaktor ist insgesamt 2 mal 1 plus z hoch 3, wenn ich Null einsetze, kommt 2 raus, ich teile durch 3 Fakultät, der gibt ein Drittel, also plus ein Drittel, z n hoch 3, und so weiter, ne.
Dann minus ein Viertel, z n hoch 4, plus minus und so weiter, und wir haben das, okay, ich modifiziere aus, ich komme
auf N mal z n, minus ein halb N z n Quadrat, und dann überlegen wir mal, was mache ich weiter, was ich weiter mache, ich überlege mir mein N mal z n Quadrat, N mal z n Quadrat, wenn Sie das hier angucken, das ist beschränkt,
deswegen, weil ich weiß, was rauskommt, klar, mache ich gleich noch N mal z n Quadrat hier aus, beim Rest, dann was bleibt übrig, ein Drittel
z n, minus ein Viertel z n Quadrat, plus ein Fünftel z n hoch 3, minus und so weiter, dann weiß ich, das da ist beschränkt,
alles sehen Sie vielleicht, ne, wenn Sie sich hier z n Quadrat ausmodifizieren, Sie haben lauter so gemischte Terme, und N kommt mit maximal
Faktor eins durch N vor, alle anderen Faktoren sind kleiner als eins durch N, wenn ich es dann mit N modifiziere, bleibt das Ding beschränkt, das hier ist beschränkt, ich weiß weiterhin, z n geht gegen Null, für N gegen N, endlich sehen Sie hier auch, ne, erste Vorfaktor geht gegen Null, zweite Faktor geht gegen Null, das geht auch gegen Null, z n geht gegen Null, ich weiß das Ding hier,
ist sicherlich betragsmäßig kleiner gleich, wenn ich ganz grob abschätze, ich ziehe einen Betrag rein und schätze die ganzen ein Drittel, ein Viertel und so weiter nach oben durch eins ab, dann kommen wir, dann klammere ich noch ein z n aus, dann bleibt noch die geometrische Reihe übrig, gar gleich Null bis
und endlich z n hoch K, z n geht gegen Null, dann geht das Ganze gegen Null, für N gegen N, endlich. Und was hat uns das Ganze gebracht? Ja, das Ganze hat uns gebracht, dass das N mal log eins plus
z n gleich N mal z n minus ein halb N mal z n Quadrat plus Klein o von eins ist.
Okay, Fragen soweit, also ich rechne wild rum, aber jetzt sind wir eigentlich schon so gut wie fertig, ne, weil
jetzt setze ich da noch mal die Formel für z n ein, dann sehen Sie, was N mal z n ergibt, und Sie sehen das minus ein halb N mal z n Quadrat, da bleibt eigentlich nur noch das Quadrat von den Termen übrig, alle anderen sind viel kleiner.
Und dann addiere ich den ersten noch dazu und wir sind fertig. Daraus folgt jetzt was. Was wollen wir eigentlich überhaupt machen?
Wir wollen das log v n von u 1 bis u r ausrechnen. Ich schreibe den ersten ab, j minus i mal Summe j gleich 1 bis r, u j mal Wurzel n p j.
Und da muss ich noch dazu addieren, plus N mal z n minus ein halb N mal z n Quadrat plus o von eins, Klein o von eins.
Und ein Klein o von eins macht mir beim Limit nix aus. Klein o von eins heißt, für N gegen endlich geht der Limit gegen Null.
Also ich brauche nur noch das erste Betracht. Ich setze anschließend z n die Formel für z n ein, also wir schreiben den ersten Term wieder ab.
Dann berechnen wir N mal z n. N mal z n nach Definition von z n ergibt i mal Wurzel n mal Summe j gleich 1 bis r Wurzel p j mal u j.
Minus ein halb mal Summe j gleich 1 bis r u j zum Quadrat plus irgendwie Klein o von eins. Kann ich hinten dazu addieren.
Dann kommt ein halb N mal z n Quadrat noch dazu, bzw. minus ein halb mal N mal z n Quadrat. Also minus ein halb mal N. Und jetzt nehmen wir das z n Quadrat. Und von dem
z n Quadrat brauche ich jetzt nur Terme, die mindestens so groß sind wie eins durch N. Den Rest kann ich wieder ein o von eins reinpacken. Klein o von eins reinpacken. Das heißt, das sehen Sie, da muss ich eigentlich von dem z n nur den ersten Term quadrieren. Der Rest fällt weg.
Das gibt also ein i Quadrat durch N. Durch N mal Summe j gleich 1 bis r Wurzel p j mal u j. Und den Rest ist o von eins.
Okay, stimmen Sie soweit zu. Dann sehen Sie der Term und der Term, die sind beides mal die gleichen.
In der Tat. Einerseits mit Minus, andererseits mit Plus. Das heißt, es hebt sich weg. Es bleibt noch übrig. Minus ein halb u j zum Quadrat. Minus ein halb mal Summe j gleich 1 bis r.
Und beim zweiten, das N mit dem eins durch N kürzt sich weg. Das i Quadrat verschwindet mit dem minus eins. Das ergibt also ein plus ein halb mal. Na ja, hier habe ich einen Fehler gemacht.
Da war ein Quadrat vom Quadrieren. Minus ein halb mal Summe j gleich 1 bis r Wurzel p j mal u j zum Quadrat. Plus o von eins. Und das, was jetzt hier vorne steht, sollte jetzt eigentlich unser Viehstern sein.
Ne, das ist der Logarithmus von Viehstern. Und daraus folgt die Behauptung vom dritten Schritt.
Also ich habe gezeigt, mein Log Phi n von u eins bis ur stimmt, ist gleich dem Log Phi Stern von u eins bis ur plus ein Klein o von eins.
Das heißt, der Logarithmus von dem Phi n konfligiert gegen den Logarithmus von dem Phi Stern für n gegen endlich. Und daraus folgt wieder Phi n konfligiert gegen den Phi Stern. Fertig.
Okay, Fragen soweit? Klingt nicht so.
Okay, im Skript finden Sie jetzt zwei Schritte. Ich glaube, damit es durchsichtiger wird, fasse ich die beiden besser zusammen in einen Schritt. Das heißt, wir zeigen beides auf einmal, dann sieht man eher, was eigentlich passiert ist. Also im vierten Schritt des Beweises wählen wir jetzt eine orthogonale R-Kreuz R-Matrix A, deren letzte Zeilen ich vorgebe.
Und dann zeige ich das und ich wähle unabhängige Standard normal verteilte Zufallsware. Dann zeige ich, wenn ich u eins bis ur gleich A transponiert mal v eins bis vr minus eins null setze, dann kommt da die charakteristische Funktion Phi Stern raus.
Im vierten Schritt des Beweises wählen wir eine orthogonale Matrix A mit letzter Zeile gleich.
Und für die letzte Zeile des AR1 bis ARR nehme ich die Wurzeln aus den Wahrscheinlichkeiten, also Wurzeln aus P1 bis Wurzeln aus PR.
Dann wähle ich Z1 bis Zr minus eins Standard normal verteilten unabhängig.
Setzen dann, ich brauche jetzt u eins bis ur, ist A transponiert mal v eins bis vr minus eins und null.
Und zeigen, dass u eins bis ur die charakteristische Funktion Phi Stern hat.
Und daraus folgt dann die Behauptung, weil mit dem Städigkeitssatz von Levi-Krammer, das sagt, dass es u eins bis ur, ne das ist Tn von x eins bis, ne das ist Z1 bis Zr, haben wir das glaube ich genannt, nach Verteilung gegen u eins bis ur konvergiert.
Weil von Z1 bis Zr, richtig, hatten wir die charakteristische Funktion bestimmt.
Also wir hatten ja im ersten Schritt des Beweises oder ersten beiden Schritten des Beweises die charakteristische Funktion von Z1 bis Zr bestimmt. Das war unser Phi n. Wir haben dann gezeigt, Phi n konvergiert punktweise gegen Phi Stern.
Wenn ich jetzt zeige, dieses Phi Stern ist die charakteristische Funktion von dem u eins bis ur. Folgt mit dem Städigkeitssatz von Levi-Krammer im mehrdimensionalen, dass Z1 bis Zr nach Verteilung gegen u eins bis ur konvergiert. Und das war ja nach dem allerersten Teil des Beweises zu zeigen.
Das müssen die Vs von oben sein. Okay, also ich ändere es jetzt mal nicht an. Wir wählen V1 bis Vr-1 unabhängig von 1. Klar, Schreibfehler. Die Z1 bis Zr-1 waren ja vorgegeben. Noch Fragen? Dann hätte ich eine Frage. Ist es klar, dass diese orthogonale Matrix A existiert?
Mit dieser letzten Zeile? Oder warum finde ich so eine orthogonale Matrix?
Wir machen eine Basisvervollständigung und orthogonalisieren die dann.
Wenn ich aber eine Basis vervollständige und dann die ganze Basis orthogonalisiere, dann verändert sich natürlich das, mit dem ich anfange. Das heißt, der Punkt ist, der müsste schon Länge 1 haben. Dann ist die Frage, hat er schon Länge 1? Der erste? Der erste hat die Länge 1, die euklidische Länge, weil wenn Sie es ausrechnen,
Norm zum Quadrat, dann tun Sie ja die ganzen Wurzeln von den Wahrscheinlichkeiten quadrieren. Das heißt, Sie summieren die Wahrscheinlichkeiten auf. Summe der Wahrscheinlichkeiten war 1. Okay, da steht schon Einheitsvektor. Deswegen geht es. Gut, dann kommen wir zum eigentlichen Beweis dazu.
Ich gucke mir mal die charakteristische Funktion von diesen u1 bis ur ein. Also es sei ein Phi von u1 bis ur.
Und es sei nach Definition eben die charakteristische Funktion. Das heißt, e hoch, Erwartungswert von exponential, von i mal... Jetzt kommt das Skalarprodukt von dem Vektor u1 bis ur mit dem Zufallsvektor u1 bis ur.
Ich mache es als Skalarprodukt, also u1 bis ur. Wegen der Vektor mal Groß u1 bis ur. Und von dem Ding möchte ich zeigen, dass es gleich Phi-Stern ist.
Dann sind wir fertig. Okay, ich setze mal u1 bis ur ein. Also Groß u1 bis ur transponiert.
Das war ja a transponiert v1 bis vr. Und dann definiere ich mir kleine v1 bis vr sinnvoll genauso entsprechend.
Also ich kann hier aussehen, dass Groß v1 bis vr gleich a, weil die Matrix orthogonal ist, mal u1 bis ur ist. Jetzt definiere ich mir klein v1 bis vr gleich a mal klein u1 bis ur.
Und das ist equivalent dazu, dass u1 bis ur... Ich brauche es da eigentlich liegen. Aber wir machen es mal so. Erst mal schreiben wir es senkrecht. u1 bis ur ist gleich a transponiert mal v1 bis vr.
Und beziehungsweise, wenn ich beides transponiere, dann sehen Sie, beziehungsweise u1 bis ur liegt, ist v1 bis vr liegend mal a.
Und das setze ich jetzt ein. Also die haben diese Eigenschaft und die definiere ich so, die v1 bis vr.
Dann kann ich das umschreiben als Erwartungswert von... Ach so, und ich muss noch dazu sagen, mit v Groß r ist gleich Null. Also eigentlich habe ich ja u1 bis ur war a transponiert mal v1 bis vr minus 1.
Und dann kommt noch die Null dran. Haben Sie eine Frage? Aus der ersten folgt die zweite. Also das da habe ich gegeben für die Groß u.
Aber jetzt definiere ich mir für die Klein u entsprechende Klein v. Die Klein u sind die Argumente hier, die ich hier einsetze. Und ich möchte zeigen, für diese Argumente stimmt das Ding mit viel Stern von u1 bis ur überein. Das heißt, die Klein v sind neu. Und ich definiere sie genauso wie die Groß v.
Oder im gleichen Zusammenhang zwischen Groß u und Groß v mit Klein u und Klein v. Warum werden Sie gleich sehen? Okay, dann kann ich das umschreiben. Der liegende Vektor ist v1 bis vr. Dann kommt a.
Dann kommt von u1 bis ur ein a transponiert. Und dann kommt das v1 bis vr. Und ich schreibe es eigentlich wieder anders um. V1 bis vr minus 1. Der letzte war ja Null. Dann bin ich so. Und jetzt sehen Sie, was passiert ist.
Ich habe hier a mal a transponiert, aber orthogonal. Das heißt, die Matrix fällt weg. Das war der Witz. Also hier sind große v. Und hier sind kleine v.
Ja. Jetzt kommt a orthogonal. Dann ist es der Erwartungswert. I mal jetzt v1 bis vr.
Mal Groß. V1 bis vr minus 1. Und Null. Dann kann ich dieses Skalarprodukt ausrechnen.
I mal, das gibt jetzt die Summe, j gleich 1 bis r minus 1. Vj mal Groß vj.
Ja, und hat jemand einen Vorschlag, was das ergibt? Ich behaupte, das können wir jetzt unmittelbar hinschreiben.
Die Summe können wir mit dem Produkt ausziehen, weil die v1 bis vr minus 1 unabhängig sind. Dann haben wir das Produkt von, ja, machen wir mal. Produkt von j gleich 1 bis r minus 1. Erwartungswert von I mal vj mal vj.
Aufgrund der Unabhängigkeit. Und dann? Und dann haben wir die charakteristische Funktion von der Standard-Normalverteilung stehen, die kennen wir.
Charakteristische Funktion von der Standard-Normalverteilung an der Stelle u per e hoch minus ein halb u Quadrat. Das heißt, hier kommt e hoch minus ein halb vj Quadrat raus.
Produkt j gleich 1 bis r e hoch minus ein halb vj Quadrat. Dann sehen Sie, dann kann ich das Produkt wieder als Summe reinziehen.
Ich klammer mal so um, j gleich 1. Jetzt habe ich eigentlich, ja, ich habe hier einen Schreibfehler gemacht. Hier stand r minus 1 an der Stelle. Das heißt, ich habe hier innen jetzt eigentlich auch eine Summe bis r minus 1.
Ich mache stattdessen eine Summe mit r. Warum werden Sie gleich sehen? Vj zum Quadrat und ziehe das r noch ab. Ich nütze aus, dass diese v1 bis vr waren ja a mal u1 bis ur.
A war orthogonal, also stimmt die Länge von v, den v1 bis vr mit der Länge von u1 bis ur überein. Also ich habe nochmal a orthogonal. Dann kommt exponent von minus ein halb mal j gleich 1 bis r uj zum Quadrat.
Und jetzt brauche ich das vr, ziehe ich noch ab. Und von dem vr, ja, vr ist die letzte Zeile von a mal diesen Vektor u1 bis ur. Die letzte Zeile von a haben wir aber speziell gewählt.
Das heißt, das kommt da oben. Minus j gleich 1 bis r. Letzte Zeile ist Wurzel aus pj mal uj. Und wenn die Welt gerecht ist, dann war das das, was wir zeigen wollten.
Oder was ich zeigen wollte. Oder doch nicht. Naja, zum Quadrat. Die Welt ist schon gerecht, aber Schreibfehler sind schon noch drin.
Und wenn man jetzt nochmal nach der Definition von dem V-Stern eigentlich anguckt, das war minus ein e hoch minus ein halb mal summe j gleich 1 bis r uj Quadrat minus in Klammern j gleich 1 bis r uj mal Wurzel pj zum Quadrat. Das heißt, in der Tat, hier steht V-Stern von u1 bis ur.
Und wir sind fertig. Fragen? Fragen soweit?
Also wenn Sie angucken, war eigentlich ein relativ durchsichtiger Beweis. Es gab eine technische Stelle, nämlich den Grenzwert der charakteristischen Funktion ausrechnen. Und von dem technischen Level eben, ich habe die ganzen Sätze, die wir im Eindimensionalen gemacht haben, zur Verteilungskonvergenz, also insbesondere den Städigkeitssatz,
von dem die Grammer eben mehrdimensional angewendet. Aber das ist nicht arg viel schwieriger zu beweisen. Ansonsten war der Beweis komplett. Und eigentlich, wie ich finde, eine ganz hübsche Aussage. Also keine Ahnung, wie man da draufkommt. Das ist die andere Sache. Oder, ich meine, im Prinzip geht es ja standardmäßig.
Also diesen Grenzwert rechnen wir noch aus. Aber dann zu sehen, dass das die richtige charakteristische Funktion ist, das ist irgendwie, aber gut, kann man vielleicht. Ich weiß auch nicht.
Okay, Fragen soweit? Scheinen keine zu sein. Dann mache ich fünf Minuten Pause zum Tafelwischen. Und ich mache dann um 10.39 Uhr weiter. Ja, würde ich ganz gern weitermachen?
Herr Weinbender? Okay, also Satz 8.3 führt auf den sogenannten Chi-Quadrat-Anpassungstest. Wir lehnen H0 zum Niveau Alpha aus 0,1 ab,
falls eben die Prüfgröße größer als das Alpha-Fraktil von der Chi-Quadrat R-1-Verteilung ist.
Satz 8.3 führt auf sogenannten Chi-Quadrat-Anpassungstest, lehne H0 zum Niveau Alpha aus 0,1 ab,
falls Tn von x1 bis xn größer als Chi-Quadrat R-1 Strichpunkt Alpha
und es ist Alpha-Fraktil von Chi-Quadrat R-1.
Das Ganze ist jetzt nicht unbedingt ein Test zum Testniveau Alpha, aber die Fehlerwahrscheinlichkeit erster Art konvegiert zumindest für n gegen endlich gegen Alpha nach Satz 8.3. Also nach Satz 8.3 ist dieser Test für n gegen endlich ein Test zum Niveau Alpha.
Ich schreibe es mal so hin.
Und gemeint ist eben, die Fehlerwahrscheinlichkeit erster Art dieses Testes konvegiert für Stichprobenumfang n gegen endlich gegen Alpha. Ich mache ein paar Bemerkungen dazu.
Die erste Bemerkung ist, dass Sie die Berechnung der Prüfgröße eigentlich vereinfachen können. Wenn Sie ausmultiplizieren, lasse ich weg, sehen Sie im Skript. Die zweite Bemerkung, das war das, was wir schon mal angesprochen haben. Es gibt eine Faustregel. Also beim Chi-Quadrat-Anpassungstest gilt folgende Faustregel.
Die C1 bis CR und N sollen so gewählt sein, dass N mal PJ0 größer gleich 5 ist. So, Faustregel. Wähle C1 bis CR und N so.
Aber für C1 bis CR, N soll gelten. N mal PJ0, das ist ja N mal die Wahrscheinlichkeit, dass bei wahrer Verteilungsfunktion F0,
dass dann X1 in Cj drin liegt. Das soll größer gleich 5 sein für J gleich 1 bis R.
Dann das zweite Problem. Meistens möchte man ja nicht genau wissen, ob eine spezimte Verteilung vorliegt. Also hier, Faustregel. Für C1 bis CR und N soll gelten. N mal PJ0 gleich N mal Wahrscheinlichkeit bei F gleich F0.
X1 element Cj soll größer gleich 5 sein für J gleich 1 bis R. Sie können irgendwas nicht lesen oder?
Großer gleich 5. Und es ist eben die magische 5, die irgendwo herkommt. Ich weiß auch nicht woher. Aber es ist ja eine Faustregel. Also es ist eben die Faustregel, damit man sagt, die asymptotisch greift. Zweite Bemerkung, die ich machen möchte,
meistens möchten sie ja nicht wissen, ob eine spezielle Verteilung vorliegt. Also zum Beispiel liegt eine Standard-Normalverteilung vor, sondern sie wollen wissen, liegt überhaupt eine Verteilung aus einer gewissen Klasse vor. Das heißt, sie geben eigentlich eine Klasse vor. Und da gibt es eine Modifikation vom Chi-Quadrat-Test. Bemerkung B.
Möchte man wissen, ob eine Verteilung aus einer vorgegebenen Klasse Wteta, Teta aus Großteta, mit, ich nehme vereinfachen an, Teta Teilmenge R, von Verteilungen stammt, kann beim Chi-Quadrat-Anpassungstest wie folgt vorgehen. Man testet zunächst mit Hilfe des Maximum, oder man schätzt zunächst mit Hilfe des Maximum-Like-Dehoods-Prozesses dieses Teta durch sein,
durch ein Maximum-Like-Dehood-Schätzer. Und nimmt dann diesen Wert und testet für damit den ganz normalen Chi-Quadrat-Anpassungstest durch. Allerdings jetzt nicht mehr mit einem Fraktil mit R-1 Freiheitsgraden, sondern weil sie einen Freiheitsgrad geschätzt haben, mit einem Fraktil mit R-2 Freiheitsgraden. Also sie nehmen dann hier einen Fraktil mit R-2 Freiheitsgraden.
Okay, ich schreibe es hin. Möchte man wissen, ob eine Verteilung aus einer vorgegebenen Klasse Wteta stammt? Ob eine Verteilung aus einer vorgegebenen Klasse Wteta, Teta aus Großteta mit Teta Teilmenge R vorliegt?
Schreiben wir vielleicht so.
Wteta, Teta Element Großteta mit Teta Teilmenge R vorliegt.
Kann man beim Chi-Quadrat-Anpassungstest die Folgen vorgeben.
Y1 bis Yr seien die beobachteten Werte von Großy1 bis Yr.
Also seien Kleiny1 bis Kleinyr beobachtete Werte von Großy1 bis Großyr.
Ich definiere nun dieses Pj0 in Abhängigkeit von Teta als Pj0 als Wahrscheinlichkeit bei Warnparameter Teta, dass x1 ein Cj ist, das wäre das Wteta von Cj.
Ich setze Pj0 von Teta gleich Wahrscheinlichkeit bei Warnparameter Teta. x1 Element Cj, das wäre mein Wteta von Cj.
Dann schätzen wir Teta durch ein Maximum-Likelihood-Schätzer.
Und zwar nehme ich den Maximum-Likelihood-Schätzer zu den Daten Y1 bis Yr. Das heißt, ich sage mein Teter-Dach wäre das argmax von Teta aus Teta.
Dann habe ich Y1 Werte habe ich in C1, was Wahrscheinlichkeit P1,0 von Teta hat. Das kommt mit Wahrscheinlichkeit P1,0 von Teta hoch Yr vor, hoch Y1 vor und so weiter.
Und dann muss ich noch, oder ich gleich noch aus, aber im Prinzip bräuchte ich es gar nicht, die Anzahl Möglichkeiten, die es dafür gibt, weil die nicht von Teta abhängen. Dann nehmen wir P1,0 von Teta hoch Y1, Pr0 von Teta hoch Yr.
Und machen das als Maximum-Likelihood-Schätzer.
Und dann testen wir Nullhypothese H0. Es existiert ein Teta, ein Teta, sodass Px gleich Wteta ist, versus H1. Das ist nicht der Fall. Durch die Betrachtung von der Prüfgröße, die bisher mit Teta0, oder wo wir Teter-Dach verwenden als Verteilung der Nullhypothese
und vergleichen das mit dem r-2-Alpha-Fraktil der chi-Quadrat-Verteilung. Teste, oder wir machen so Lene H0.
Das wäre es existiert, ein Teta, ein Teta, sodass Px vielleicht Px1 gleich Wteta ist. All die Nullhypothese ist falsch angegeben im Skript. Da habe ich einfach geschrieben Px1 gleich Wteter-Dach,
aber das können Sie ja nicht erwarten, weil das Teter-Dach ist eine Punktschätzung, die wird immer ein bisschen daneben liegen, sondern das ist eigentlich die Nullhypothese. Wir lehnen das zum Niveau Alpha aus Null1 ab,
falls eben meine Prüfgröße Tn von x1 bis xn definiert als, so wie bisher, nur mit dem Pj0 ersetzt durch das Pj0 von Teter-Dach. Also Summe j gleich 1 bis R.
Falls dieses Ding größer ist als chi-Quadrat Alpha-Fraktil, aber jetzt eben mit r-2-Freiheitsgraden.
Also r-2 statt r-1, weil ich ein Parameter geschätzt habe. Und man kann auch hier wieder zeigen, machen wir nicht asymptotisch legten Test zum Niveau Alpha vor.
Okay, Fragen soweit? Keine Fragen.
Da möchte ich das Ganze anwenden auf ein klassisches Beispiel. Und zwar handelt es sich um die Toten durch Hufschlag in preußischen Kavallerie-Regimentern. Also die preußischen Kavallerie-Regimentern, das waren die mit Pferden.
Und wenn Sie so ein Pferd haben, dann kriegen Sie ab und zu so einen Hufschlag mal. Und früher war das eben so, dass da ab und zu Leute, oder es ist heute immer noch so, ab und zu Leute drin gestorben. Und dann gab es zehn verschiedene preußische Kavallerie-Regimenter. Über 20 Jahre hinweg wurde in jedem einzelnen Jahr die Anzahl der Toten durch Hufschlag gezählt.
Also gab es keinen Toten, gab es einen Toten, gab es zwei Toten. Die Maximalzahl war vier. Ich muss gestehen, ich weiß nicht, wie groß ein preußisches Kavallerie-Regiment ist. Also mindestens vier, das ist klar. Oder es kann auch sein, es war einer und der wurde vom gleichen Pferd immer wieder geschlagen. Und dann bekommen Sie einen Datensatz. Und wir wollen diesen Datensatz statistisch modellieren.
Das könnten Sie so machen, dass Sie sagen, ja, diese Pferde, die machen eine gewisse Anzahl von Tritten, kriegen die Soldaten immer ab. Und mit einer gewissen Wahrscheinlichkeit sterben sie dran. Mit einer gewissen anderen Wahrscheinlichkeit nicht. Dann hätten Sie eigentlich eine Binomialverteilung. Wenn Sie davon ausgehen, die Sachen sind unabhängig voneinander.
Also nach dem ersten Tritt ist der Soldat nicht vorsichtiger. Oder das Pferd wird auch nicht ausgemustert nach dem ersten Tritt oder sowas. Dann hätten Sie eine Binomialverteilung. Sie wüssten aber nicht, wie groß das N ist. Und jetzt approximieren wir die Binomialverteilung einfach durch eine Poissonverteilung. Wir nehmen ein N ist groß, viele Tritte.
Die Wahrscheinlichkeit fürs Sterben ist klein. Und nehmen eine Poissonverteilung und wollen dann testen, ist es sinnvoll oder ist es möglich, diese Daten durch eine Poissonverteilung zu modellieren. Okay, wir schreiben es mal hin. Oder ich schreibe es hin.
Also Beispiel. Ich kurz ein bisschen ab, dass ich durchkomme heute. Also wir machen Tode durch Hufschlag in preußischen Kavallerie-Regimentern.
Die beobachten Daten sind.
Wir haben Anzahl Tote im Jahr. Und die Anzahl Regimenter, die diese Eigenschaft haben.
Ich habe insgesamt zehn Regimenter über 20 Jahre, also 200 Datenpunkte. Und die sortiere ich jetzt je nachdem. Gab es null Tote. Gab es einen Tod. Gab es zwei Tote. Gab es drei Tote. Gab es vier Tote. Oder gab es größer gleich fünf Tote. Das heißt, ich mache eigentlich gleich schon so eine Klasseneinteilung,
wie beim Chi-Quadrat-Anpassungstest. Nur die eine Menge enthält eben als ganze Zahl nur die Null. Die andere die Eins. Die Dritte die Zwei. Die Viertel die Drei. Die Fünfte die Vier. Und die Sechste alle größer gleich fünf. Null gab es 109 Mal.
Einen Toten gab es 65 Mal. Zwei Tote gab es 22 Mal. Drei Tote gab es dreimal. Einen Toten gab es viermal. Und ich möchte jetzt die eigentlich die 200 Datenpunkte dieser Tabelle zugrunde legen. Ich habe 200 Datenpunkte x1 bis x200.
mit Anzahl von Toten. Und ich möchte wissen, ob das eine Realisierung von einer Posser-Verteilung ist. Also Frage. Kann man die Anzahl der Toten durch Hufschlag in einem Jahr Schräg-Schräg-Regiment durch eine Posser-Verteilung beschreiben?
Oder modellieren? Kann man die Anzahl Tote durch Hufschlag pro Regiment und Jahr?
Also ich weiß gar nicht, wie es bei der Bundeswehr heutzutage ist. Also ich nehme an, Tote durch Hufschlag gibt es nicht mehr so in größeren Zahlen. Aber ich nehme auch an, also wahrscheinlich sind die Zahlen auch relativ hoch im Vergleich zum heutigen.
Also wahrscheinlich war damals das einzige Soldatenleben eben noch nicht so wichtig oder so. Heute wäre das wahrscheinlich ein Skandal, wenn Sie vier Tote in einem Regiment hätten. Wobei ich nicht weiß, wie groß das Regiment ist, aber ich nehme an, das wird nicht beliebig groß sein.
Okay, Fragestellung klar so weit? Und nochmal, das sind nicht meine X1 bis 200, die ich beobachtet habe. Sondern meine X1 bis 200 sind schon zusammengefasst, wie bei dem, wie bei dem Chi-Quadrat-Anpassungstest.
Ich habe Bereiche angegeben, habe gesagt, in dem Bereich liegen so und so viel drin, dem Bereich liegen so und so viel drin. Ich habe damit eigentlich oder ich kann so sagen, von 100, ich habe bei dem X1 bis 200 sind 109 Beobachtungen mit einer Null. Es sind 65 Beobachtungen mit einer Eins, sind 22 Beobachtungen mit einer Zwei und so weiter. Und überhaupt keine Beobachtungen mehr mit Wertgröße gleich fünf.
Und da die Reihenfolge bei Unabhängigkeit keine Rolle spielt, reicht das, um meine Daten vollständig zu beschreiben. Also testen möchten wir H0. Es existiert Teta größer Null, sodass Px1 eine Portofon-Teta-Verteilung ist versus H1. Das ist eben nicht der Fall. Wir fangen an mit einer Klasseneinteilung.
Das heißt, ich gebe Mengen C1 bis Cr vor.
Wenn Sie sich die Fälle angucken, dann würden Sie naheliegenderweise sagen, ja, Sie machen die Nullen eine Menge, die Eins, die Zwei, die Drei und alle Zahlen größer gleich vier. Und machen dann fünf verschiedene Mengen C1 bis C5. Wenn Sie das machen, stellt sich heraus, dass Ihre Braustregel hinterher verletzt sein wird. Deswegen mache ich es nicht. Ich mache eine gröbere Unterteilung mit nur vier Mengen.
Also ich fange an mit C1 minusenendlich bis Null. C2 Null bis Eins. Eins dazu, Null nicht. C3 eins bis zwei. Und C4 sind die größer als zwei.
Wenn ich das so mache, wie groß ist dann Y1, Y2, Y3 und Y4?
Kann mir vielleicht jemand von Ihnen sagen. Also aus der oberen Tabelle komme ich jetzt auf Y1 bis Y4.
Für den Letzten nehme ich 169, 65, 22 und der Letzte hat vier. Also der Erste ist 109 für die Null. Der Zweite ist 65. Der dritte ist zwei. Weil in dem Intervall von eins bis zwei, wären nur die zwei drin, da gibt es eben zwei.
Das heißt, ich habe hier zwei. Ich habe hier 65. Ich habe hier 109. Während beim Letzten muss ich halt aufaddieren. Beim Vierten, das wären die größer als zwei. Also drei und vier. Das ist drei plus eins.
Im Dritten sind 22. Habe ich mich verschrieben. Dankeschön. 22 und vier. Dann kann ich meine Pj0 ausrechnen. Das gilt.
Also in Abhängigkeit von Theta will ich jetzt wissen, welche Wahrscheinlichkeitsmasse tut die Poissonverteilung in diese entsprechenden Intervalle? Okay, kann mir das jemand sagen? Welche Wahrscheinlichkeitsmasse tut die Poissonverteilung in C1, C2, C3 und C4 ein?
Die Erzähldichte von Poissonverteilung war Theta hoch k durch k Fakultät mal e hoch minus Theta.
Das erste ist e hoch minus Theta. Das heißt, Theta hoch j minus eins. Durch j minus eins Fakultät mal e hoch minus Theta. Kann ich sagen, richtig?
Also eigentlich habe ich hier einen Theta hoch j minus eins durch j minus eins Fakultät. Mal e hoch minus Theta für Theta Element. Nee, für j Element. Und wir haben festgestellt, das gilt fürs erste Element eins. Nee, falsch.
Dann fürs zweite auch noch. Fürs dritte auch noch. Und dann brauche ich das vierte. Und beim vierten habe ich irgendwie ein Problem, weil das vierte ist nicht mehr schön. Aber das vierte ist einfach eins minus die anderen.
Also eins minus die erste, zweite, dritte.
Dann machen wir den Maximum-Light-Diode-Schätzer. Das ist Thetadach. Die jenige Stelle, wo Theta aus Null bis in Endlich, wo eben folgende Funktion maximal wird.
Wir brauchen die 200 Fakultät durch 109 Fakultät mal 65 Fakultät mal 22 Fakultät mal 4 Fakultät.
Dann beim ersten ist es einfach e hoch minus Theta, die Wahrscheinlichkeit. Und dann die hoch 109. Dann kommt Theta mal e hoch minus Theta hoch 65.
Dann kommt als nächstes Theta Quadrat durch 2 mal e hoch minus Theta hoch 22.
Und dann kommt eins minus die ersten drei. Eins minus e hoch minus Theta minus Theta mal e hoch minus Theta minus Theta Quadrat halbe.
Mal e hoch minus Theta und das ganze noch hoch 4. Und dann sehen Sie, dann haben Sie irgendwie ein Problem. Dann wollen Sie diesen Maximum-Light-Diode-Schätzer ausrechnen. Aber die Funktion ist hinreichend hässlich, dass Sie das Minimum nicht mehr sofort hinschreiben können.
In Abhängigkeit von Theta. Was Sie jetzt machen können, aber Sie haben die konkrete Funktion. Wir versuchen, wir brauchen eine Maximal-Stelle, nicht eine Minimal-Stelle. Maximal-Stelle. Wir können die Funktion einfach plotten. Und dann können Sie numerisch ungefähr gucken, wo das Ding liegt. Und wenn Sie das ungefähr numerisch machen, also numerisch, da kommen Sie auf ungefähr 0,61.
Damit, ich gucke mir mal an, ist die Faustregel erfüllt. Wir machen eine Tabelle mit j n mal p j 0 von Thetadach.
Und das können Sie jetzt ausrechnen. Bei 1 kommt 108,7 raus. 66,3. Bei 3 ist 22,2.
Und bei 4 ist es 5. Und Sie sehen, in der Tat, bei dem 4 ist die Faustregel gerade noch erfüllt. Und man sieht eigentlich auch, warum ich diese Zusammenfassung so gemacht habe. Aber wenn ich eben noch eine Menge mehr gemacht hätte, hätte sich herausgestellt, das wäre nicht mehr richtig gewesen. Und wenn Sie die erwarteten Werte mit den tatsächlichen Vergleichen, sieht gar nicht mal so schlecht aus.
Ist relativ nah dran. Das ist das Erste. Das Zweite, wir können jetzt die Prüfgröße ausrechnen.
Das wäre das T n von x 1 bis x n, nenne ich es mal. Das wäre die Summe y gleich 1 bis 4. Y j mit n mal p j 0 zum Quadrat durch n mal p j 0.
Können Sie mit dem Taschenrechner einsetzen. Kommen wir auf ungefähr gleich.
Und wenn wir Alpha als 5% wählen und vergleichen mit dem Chi-Quadrat-Fraktil von r minus 2 Alpha-Verteilung. Dann sehen wir, das da ist kleiner als 5,99. Das wäre die Chi-Quadrat-Fraktil zu 2 und 0,05.
Beziehungsweise eben das Chi-Quadrat-Fraktil zu r minus 2 und 5%. Und dann sehen Sie, A0 kann zum Niveau Prozent nicht abgelehnt werden.
Und es spricht also in dem Sinne nichts dagegen, dass es eine Poissonverteilung ist.
Wie immer beim statistischen Test ist es eigentlich unangenehm, weil wir wollen ja die Gegenhypothese sichern. Wenn Sie noch mal unsere Daten angucken, unsere ursprünglichen Daten. Ich schreibe es vielleicht noch mal schnell hin.
Ich habe es leider gerade weggewischt. Die ursprünglichen Daten, wir hatten die 0, 1, 2, 3, 4 größer gleich 5. Das war 109, 65, 22, 3, 1, 0.
Können Sie mir irgendeine Verteilung nennen, bei der der Chi-Quadrat-Anpassungstest die Nullhypothese ablehnen würde? Und tunlich sollten natürlich noch die Faustregel erfüllt sein.
Sonst wäre es irgendwie witzlos. Was fallen Ihnen für alternative Verteilungen ein? Eine Normalverteilung könnte ich hier nehmen. Ich könnte versuchen, wäre aber schwierig das so. Vielleicht irgendwas einfaches.
Eine Gleichverteilung, wir nehmen einfach eine Gleichverteilung. Wir sagen vielleicht, die Anzahl Toten ist gleich verteilt auf 0, 1, 2, 3, 4. Ist ja uns offensichtlich nicht. Aber wäre die Frage. Okay, dann mache ich eine Gleichverteilung. Ich würde es vielleicht als kontinuierliche Verteilung auffassen.
Und ich mache es irgendwie so, dass ich eben sage, wie viele natürliche Zahlen nehme ich insgesamt dazu. Das ist noch die Klasse von Verteilungen. Also nehme ich eine Gleichverteilung nur auf der Null, auf der Null oder 1, 0, 1, 2. Und das mache ich jeweils mit zu kleinen Intervallen drum herum. Dann würde ich ein Maximum-Light-Diode-Prinzip machen. Und wenn Sie sich überlegen, wo enden ich dann? Na ja, sobald ich eine Gleichverteilung habe, wo die 4 keine Masse mehr hin tut, also keine Masse auf der 4,
oder eine dieser Zahlen, die beobachtet sind, keine Masse auf der 4, dann hätte die Light-Diode-Funktion gleich 0. Das heißt, das kann schon mal nicht sein. Und andererseits soll die Gleichverteilung auf möglichst wenige Zahlen
konzentriert sein, damit diese einzelnen Wahrscheinlichkeiten möglichst groß sind. Das heißt, ich würde eigentlich eine Gleichverteilung nehmen auf 0 bis 4. Das heißt, fünf verschiedene Werte. Wenn Sie sich dann überlegen, wie groß ist die Wahrscheinlichkeit von jeder der Werte, hat dann Wahrscheinlichkeit ein Fünftel. Das heißt, das Pj0 ist jeweils ein Fünftel. Und das N mal Pj0 wäre 200 mal ein Fünftel, also 40.
Das heißt, unsere Faustregel wäre erfüllt. Dann können wir uns angucken, was wäre unsere Grüßgröße. Unsere Grüßgröße wäre im ersten Fall 109 minus 40 zum Quadrat, also 60 zum Quadrat durch 40. 60 zum Quadrat durch 40 ist schon mal mindestens größer als 60, wäre ganz klar schon vom ersten her größer als 5,99.
Das heißt, in der Tat, wir würden auch eine Verteilung ablehnen. Sonst wäre die Sache ja auch irgendwie witzlos. Okay, noch Fragen dazu? Dann noch mal der Hinweis. Donnerstag fällt die Vorlesung aufs. Und ab nächste Woche fangen wir an.
Ich mache noch einen Kapitel zu nicht-parametrische Regressionsschätzung mit festen Design. Statt zuzügen zu einem, was wir bisher hatten. Dann wäre ich fertig für heute.