28A.2 Mittelwertbildung verringert Varianz und Standardabweichung
This is a modal window.
The media could not be loaded, either because the server or network failed or because the format is not supported.
Formal Metadata
Title |
| |
Title of Series | ||
Number of Parts | 89 | |
Author | ||
License | CC Attribution - NonCommercial - ShareAlike 3.0 Germany: You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal and non-commercial purpose as long as the work is attributed to the author in the manner specified by the author or licensor and the work or content is shared also in adapted form only under the conditions of this | |
Identifiers | 10.5446/10000 (DOI) | |
Publisher | ||
Release Date | ||
Language | ||
Producer |
Content Metadata
Subject Area | |
Genre |
2
3
5
6
29
68
76
78
80
86
00:00
PhysikAverageSchwankungSummationVarianceExpected valueSquareRandom variableMathematicsCubePhysics experimentsZustandsgrößeComputer animationDiagram
03:07
Expected valueSquareSummationTerm (mathematics)Random variableComputer animationDiagram
04:28
Expected valueSquareComputer animation
05:01
Random variableProduct (category theory)VarianceExpected valueLogical constantSquareMittelungsverfahrenSet (mathematics)StreckeSphereComputer animationDiagram
08:19
Expected valueStandard deviationSquareVarianceRandom variableAverageSummationProduct (category theory)AdditionSchwankungFehlerrechnungPhysikCubeComputer animation
13:33
VarianceRandom variableMittelungsverfahrenStandard deviationMetreCubeMeasurementZahlFactorizationSummationComputer animationDiagram
15:34
VarianceRandom variableSummationFactorizationSchwankungAverageStandard deviationSquareComputer animation
17:54
VarianceStandard deviationAverageSquareComputer animation
18:41
MeasurementComputer animation
19:11
TrailMeasurementRandbedingung <Mathematik>Computer animation
20:11
Normal distributionAverageCentral limit theoremDirection (geometry)Probability distributionNormal distributionComputer animationDiagram
Transcript: German(auto-generated)
00:01
Jetzt kennen Sie das aus der Physik, dass man mehrmals misst und dann den Mittelwert bildet, um die Schwankung kleiner zu machen. Wenn ich zufällige Fehler habe, messe ich einfach häufig und bilde dann den Mittelwert, um diese zufälligen Fehler in der Wirkung etwas rauszunehmen.
00:23
Und das können wir jetzt ausrechnen, wie stark die Schwankung dadurch sinkt. Kommen wir uns erstmal vorab aber auf Folgendes an. Was ist die Varianz einer Summe zweier Zufallsgrößen?
00:40
Das ist ein Hilfsmittel, was man dann dafür verwenden kann. Die Varianz der Summe, nicht einer Summe, es gibt nur eine Summe. Varianz der Summe zweier Zufallsgrößen x plus y. Die soll die Varianz Sigma x Quadrat haben, die soll die Varianz Sigma y Quadrat haben.
01:03
Und die beiden Zufallsgrößen sollen unabhängig sein. Ich will jetzt nicht die mathematische Definition von unabhängig an der Stelle bringen. Das, was man sich darunter vorstellt, die Augenzahl auf dem einen Würfel, die Augenzahl auf dem anderen Würfel, das wäre die Bedeutung von unabhängig.
01:21
Nicht unabhängig wäre, das Beispiel war gerade, stellen Sie sich vor, beim Bowling. x ist, wie viele Kugeln irgendein Spieler beim ersten Wurf erwischt, y wie viel er beim zweiten Wurf erwischt. Wenn es ein guter Spieler ist, werden beide groß sein. Wenn es ein schlechter Spieler ist, werden beide klein sein.
01:42
Die wäre nicht unabhängig dann voneinander. Bei den üblichen Fehlern beim Messen in irgendwelchen physikalischen Experimenten, geht man davon aus, dass die unabhängig voneinander passieren, es sei denn, man hat einen guten Grund dafür, dass die abhängig voneinander sind.
02:00
Von dieser Summe möchte ich jetzt die Varianz ausrechnen. Das heißt, ich gucke mir an den Erwartungswert von, wir wissen jetzt ja, was die Varianz ist. Die Varianz ist Erwartungswert vom Quadrat minus Quadrat vom Erwartungswert.
02:23
Das schreibe ich jetzt für diese Summe hin. Sie machen ein Experiment millionenmal, messen eine Größe jeweils und messen eine andere Größe. Und was Sie aufschreiben, ist die Summe dieser beiden. Und die Varianz kriegen Sie jetzt, indem Sie die Summe nehmen und quadrieren.
02:43
Davon den Mittelwert minus der Erwartungswert der Summe quadriert. Das ist dieselbe Formel, wie eben jetzt nur auf die Summe angewendet. Was ist die Varianz einer Zufallsgröße?
03:05
Es ist der Erwartungswert dieser Zufallsgröße ins Quadrat minus das Quadrat des Erwartungswerts dieser Zufallsgröße. Egal, wie die Zufallsgröße nun heißt. In diesem Fall heißt die Zufallsgröße X plus Y.
03:26
Und nun kann man, weil das ein Quadrat ist, nicht diese einzelnen Terme auseinandernehmen. Hier vorne steht also, ich mach das erstmal innen drin, innen drin mit dem Quadrat steht da das Quadrat von X plus 2 mal X Y plus das Quadrat von Y.
03:45
Hier hinten auch. Ich muss aber erst den Erwartungswert auseinandernehmen. Hier hinten der Erwartungswert einer Summe ist der Erwartungswert vom ersten plus der Erwartungswert vom zweiten. Dann kann ich das hinten genauso auseinandernehmen. Das Quadrat dieser Summe wird dann also werden der Erwartungswert von X Quadrat plus 2 mal
04:08
der Erwartungswert von X mal der Erwartungswert von Y plus der Erwartungswert von Y ins Quadrat.
04:21
Ich hoffe, dass man jetzt irgendwelche dieser Trümmer zusammensortieren kann. Mal sehen, hier vorne haben wir den Erwartungswert von X Quadrat plus, hier kommt jetzt 2 mal der Erwartungswert von X mal Y plus der Erwartungswert von Y ins Quadrat.
04:46
Und hier hinten kommt minus der Erwartungswert von X ins Quadrat. Minus 2 mal das Produkt, minus den da hinten. So, aber ja, das sieht ja trümmermäßig aus.
05:05
Können Sie irgendwas darin wiedererkennen? Also der erste hier, der müsste einem auffallen. Das Mittel vom Quadrat minus das Quadrat vom Mittel. Hier vorne steht die Varianz Sigma Quadrat von X. Hier hinten Mittel vom Quadrat minus das Quadrat vom Mittel.
05:23
Hier steht die Varianz von Y. Und den in der Mitte, den muss man jetzt wegdiskutieren. Lustigerweise fliegt der raus. Wenn X und Y unabhängig sind, nichts miteinander zu tun haben, dann können Sie lustigerweise den Erwartungswert des Produkts schreiben als das Produkt der Erwartungswerte.
05:45
Das geht nicht immer. Das muss ich vielleicht nochmal ganz dringend sagen. Wenn Sie den hier zum Beispiel haben, den Erwartungswert von X mal X, dann ist das im Allgemeinen nicht dasselbe wie der Erwartungswert von X mal der Erwartungswert von X.
06:02
Das haut nicht hin im Allgemeinen. Haben Sie irgendeine willige Idee für ein Gegenbeispiel, dass ich in der Situation diesen Erwartungswert nicht auseinandernehmen kann? Ich mache mal etwas auf. Wenn Ihr X folgende Verteilung hat, es ist minus
06:23
eins mit einer bestimmten Häufigkeit und mit derselben Häufigkeit auch plus eins und sonst nichts. Warum klappt das hier unten dann nicht? Genau, für diese Zufallsgröße ist der Schwerpunkt e von X null zwangsläufig. Wenn Sie das mitteln, 500.000 mal eins, 500.000 mal minus eins, Sie kriegen auf lange Strecke null raus für den Erwartungswert.
06:47
Aber das Quadrat dieser Zufallsgröße, wenn die immer nur plus eins oder minus eins ist, das Quadrat dieser Zufallsgröße ist immer plus eins. Der Erwartungswert von immer plus eins ist eins und eins ist nicht beim besten Willen nicht das Produkt aus null mal null.
07:01
Also Sie können nicht in jedem Fall auf diese Weise ein Produkt im Erwartungswert zerlegen. Wenn einer eine Konstante ist, dreimal X, dann können Sie die drei rausziehen. Aber wenn beides Zufallsgrößen sind, dann wird es heikel. Ich darf das aber tun, wenn diese beiden Zufallsgrößen, wie hier X und Y, unabhängig sind.
07:23
Dann darf ich das tun. Das muss ich vielleicht noch mal ein bisschen mehr erklären, warum das da plötzlich geht. Das in der Mitte ist null, weil X und Y unabhängig sein sollen. Wenn Sie zwei unabhängige Zufallsgrößen haben, dann ist der Erwartungswert des Produkts gleich dem Produkt der Erwartungswerte.
07:50
Weiter nennen Sie sich noch an unabhängige Ereignisse. Da hatte ich die Wahrscheinlichkeit, dass beides passiert. Das Ereignis A und das Ereignis B, die Schnittmenge der Ereignisse. Die Wahrscheinlichkeit, dass beides passiert, war das Produkt der Wahrscheinlichkeiten bei unabhängigen Ereignissen.
08:05
Bei unabhängigen Zufallsgrößen ist das lustigerweise dasselbe, aber dann für die Erwartungswerte. Der Erwartungswert des Produkts wird das Produkt der Erwartungswerte. Jetzt werden wir noch ein bisschen mehr auseinandernehmen, wieso das passiert. Wenn Sie mal Folgendes aufschreiben.
08:20
Der Erwartungswert von X minus seinen Erwartungswert mal Y minus seinen Erwartungswert. Dann ist das, glaube ich, leichter zu verstehen. Dieser Erwartungswert, der sollte null sein.
08:42
Ich gucke mir an, wann geht X nach oben, dann wird das plus oder nach unten negativ. Mal wann geht Y nach oben oder wann geht Y nach unten, dann wird dieses hier positiv oder negativ. Das sollte sich auf lange Sicht wegheben. Das sollte null werden. Dann nehmen Sie diesen Ausdruck hier und klammern aus.
09:01
Führe ich jetzt nicht vor, aber so kommt man drauf. Den Ausdruck nehmen Sie buchstabierend aus und finden genau das, dass die Erwartungswerte des Produkts gleich dem Produkt der Erwartungswerte sein muss. Okay, was haben wir also nun gelernt? Die Summe zweier unabhängiger Zufallsgrößen hat eine ganz billige Varianz. Es ist einfach die Summe der Varianzen.
09:23
Sigma X Quadrat plus Sigma Y Quadrat. Beim Addieren von Zufallsgrößen, die unabhängig sind, addieren sich die Varianzen. Und das ist jetzt ein großer Trick. Es addieren sich die Varianzen. Das sind ja die Quadrate der Abweichungen. Addieren sind nicht die Abweichungen, sondern die Quadrate der Abweichungen. Das ist, warum Sie bei der Fehlerrechnung an dieser Stelle immer die ganzen zig Wurzeln haben,
09:49
weil die Abweichung, die ich jetzt hier habe, die Standardabweichung von dem hier, wird die Wurzel sein aus Sigma X Quadrat plus Sigma Y Quadrat.
10:02
Dann schreibe ich das nochmal hin, die Standardabweichung, weil das in der Physik, denke ich, auch häufiger vorkommt, dann die Standardabweichung von X plus Y. Wenn Sie zwei addieren, wird es sein, die Summe der Standardabweichung von X ins Quadrat plus der Y ins Quadrat und daraus die Wurzel.
10:28
Das hier ist ja die Varianz, das Quadrat der Standardabweichungen. Dieses hier sehen Sie ganz häufig in der Fehlerrechnung, in der Physik, denke ich. Die Fehler quadratisch summiert und dann die Wurzeln. Das ist, wenn man mit Standardabweichung rechnet.
10:42
Nicht mit Größtfehlern, sondern mit Standardabweichungen, typischen Fehlern. Dann haben Sie Quadrate und Wurzeln. So, ich wollte aber eigentlich darauf hinaus, warum denn durch Mitteln das Ganze besser wird. Was passiert, wenn ich 100 mal messe und dann mittle? Warum sinkt die Schwankung?
11:03
Das war jetzt nur ein Hilfsmittel, dass bei der Summe die Varianzen auch addiert werden. Das möchte ich nun machen. Ich messe 100 mal und werde den Mittelwert.
11:21
Nun frage ich mich, was passiert mit der Schwankung? Oder erstmal, was ist die Varianz von der Zufallsgröße, die ich da habe?
11:43
Das ist eine sehr eigenbildige Zufallsgröße. Ich habe nicht mehr ein einzelnes Experiment und nehme davon das Ergebnis, sondern ich mache 100 Experimente und bilde davon den Mittelwert. Das ist ein großes Experiment. Also ich betrachte nicht mehr meine kleinen Experimente,
12:01
sondern mein großes Experiment ist, ich mache 100 kleine Experimente und das liefert einen Wert. Und dann mache ich nochmal 100 kleine Experimente und das liefert einen Wert. Und nochmal 100 und so weiter. Das ist meine neue Zufallsgröße. Die entsteht, indem ich 100 mal ein anderes Experiment mache. Und was Sie wissen, ist, dass diese Größe, die da rauskommt, besser ist.
12:24
Weniger schwankt als die, die wir vorher hatten. Aber um wie viel, das möchte ich jetzt ausrechnen. Wir können ja erstmal die Varianz so hinschreiben. Was sollte die Varianz sein von X1 plus X2 plus und so weiter?
12:45
X100. Das sind meine 100 Messergebnisse durch 100. Ich schreibe das mal so. Diese X1 bis X100 ist mein kleines Experiment. Das ursprüngliche Experiment.
13:01
Und die Zufallsgröße meines neuen Experiments ist 100 mal das kleine Experiment zu machen und den Mittelwert zu wählen. Da kann ich wieder nach der Schwankung fragen. Was passiert erstmal mit der 100 hier? Wie kann ich die 100 nach vorne holen? Die stört mich. Ich habe schon etwas über die Varianz einer Summe.
13:23
Und bin dann sofort am Ziel, wenn ich es schaffe, die 100 nach vorne zu holen. Wie kriegen Sie die 100 aus der Varianz rausgeholt? Mal das hier oben mal hin. Was passiert, wenn ich meine Zufallsgröße verdopple? Was passiert mit der Varianz? Nehmen Sie hier den Würfel. Aber immer das Doppelte. 2, 10, 12, 8, 6, 4, 2, 4.
13:48
Ich nehme das Ergebnis vom Würfel, verdoppel es aber. Was passiert mit der Standardabweichung und was passiert mit der Varianz? Wenn ich das mache, immer die doppelte Zahl nehmen.
14:01
Wenn Sie jeden Wert mal zwei nehmen, wird in der Tat dann die Standardabweichung verdoppelt. Die Abweichungen vom Mittel sind dann ja auch 5,0, 3,5, 5,0, 1,0 oder minus 5,0. Die Abweichungen vom Mittel sind verdoppelt. Dann muss die Standardabweichung auch verdoppelt sein, wenn Sie Ihre Originalgröße verdoppeln.
14:22
Und die Varianz muss, Quadrat, vervierfacht sein. Wenn Sie Ihre Zufallsgröße verdoppeln, wird die Varianz vervierfacht sein. Wenn Sie Ihre Zufallsgröße durch 100 teilen, passiert was mit der Varianz? Die Zufallsgröße mal 3, Varianz mal 9. Die Zufallsgröße mal 10, Varianz mal 100.
14:44
Die Zufallsgröße durch 100, Varianz durch 10.000. Ein Zehntausendstel. Wenn Sie hier innen drin Meter haben, kommen bei der Varianz Quadratmeter raus. Wenn Sie ein Hundertstel Meter haben, haben Sie ein Zehntausendstel Quadratmeter.
15:03
Ein Zehntausendstel von der Varianz von x1 plus x2 plus plus plus plus x100. So, und jetzt kommt mein Hilfsmittel von eben. Wenn ich davon ausgehe, dass diese Messungen alle unabhängig voneinander sind,
15:22
dass die Fehler, die ich bei dem einen Versuch mache, statistisch unabhängig sind von dem Fehler, den ich bei dem nächsten Mini-Versuch hier mache. Was vielleicht nicht hundertprozentig wahr ist, aber schon mal eine gute Näherung. Wenn ich lauter statistische Fehler habe, dass die alle unabhängig voneinander sind, dann darf ich jetzt sagen, die Varianz von denen hier, aha, wissen wir schon,
15:43
die Varianz einer Summe, gerade ausgerechnet, die Varianz einer Summe ist die Summe der Varianten. Wenn die Summierten zufallsgrößen unabhängig sind. Das heißt, hier steht, das ist die Varianz von x1 plus plus plus plus plus die Varianz von x100
16:05
im Ergebnis des hundertsten Experiments. Die müssen sich allieren, diese Varianzen. Wie kann ich das billiger schreiben? Die Varianz von x1 plus die Varianz von x2, die Varianz von x100. Das ist hundertmal dasselbe Experiment.
16:22
Ich wiederhole immer dasselbe Experiment, das ist der Trick. Das heißt, die Schwankung des ersten ist, die Schwankung des zweiten ist, die Schwankung des dritten ist, die Schwankung des hundertsten. Alle diese Varianzen müssen gleich groß sein, weil es immer dasselbe Experiment ist. Also steht da zum Schluss hundertmal die Varianz, ich nenne es einfach x hier,
16:40
diese Varianz von x, die Varianz eines Experiments, hundertmal, steht da hintereinander. Und dann sehen Sie, was zum Schluss bleibt. Zum Schluss haben Sie hundert durch zehntausend, also einhundertstel, einhundertstel mal die Varianz des ursprünglichen Experiments. Wenn Sie hundertmal messen und den Mittelwert bilden,
17:03
ist die Varianz um den Faktor einhundertstel runter durch diese Überlegung. Der Trick ist, dass diese hundertstel hier im Nenner im Quadrat rauskommt, weil die Varianz irgendwo im Quadrat drin hat. Aber die Schwankung innen drin mit dem Faktor hundert rauskommt,
17:21
weil die Varianz einer Summe von unabhängigen Zufallsgrößen die Summe der Varianzen ist. Da kommt nur der Faktor hundert und zum Schluss gewinnt ein Faktor hundert unten. Das ist das, was man gewinnt, indem man mehrfach misst. Natürlich nicht nur hundertmal, aber ich habe das jetzt als Beispiel hundertmal genommen. Wenn Sie hundertmal messen, ist die Varianz des statistischen Fehlers um Faktor hundert runter gegenüber einem Experiment.
17:49
Und das heißt für die Standardabweichung von dem Mittelwert.
18:09
Was passiert mit der Standardabweichung? Da kommt jetzt wirklich das ein Zehntel, genau. Das ist ein Zehntel mal die ursprüngliche Standardabweichung. Die Varianz ist das Quadrat der Standardabweichung.
18:22
Wenn Sie das quadrieren, sehen Sie ein Hundertstel Sigma x Quadrat. Also, wenn ich hundertmal messe und den Mittelwert bilde, ist der zufällige Fehler ein Zehntel von dem, den ich vorher hatte.
18:42
Das ist jetzt kein supergeniales Verfahren, um seine Fehler runterzudrücken. Hundertmal messen bringt mir eine Dezimalstelle. Das ist sehr aufwendig. Da will ich eher einen neuen Messapparat kaufen, statt dass ich hundertmal messe. Wenn man es nicht ganz so hoffig macht, wenn Sie fünfmal, sechsmal, siebenmal, zehnmal messen,
19:02
dann rentiert es sich eher. Aber der Nutzen wird kleiner und kleiner durch diese Wurzel. Wird der Nutzen kleiner und kleiner, je mehr Messungen man macht. Insofern ist das kein Verfahren. Es ist kein Verfahren, um wahnsinnige Genauigkeiten zu erreichen. Nebenbei haben wir ein paar Randbedingungen eingebaut.
19:22
Die Fehler, die wir hier haben, müssen alle unabhängig voneinander sein. Stellen Sie sich vor, wenn Sie supergenaue Messungen machen, hängt der Fehler vielleicht von den Gezeiten ab. Der Anziehungskraft des Mondes. Dass irgendwas in der Apparatur mehr auseinandergezogen wird
19:40
oder weniger auseinandergezogen wird. Und Sie machen diese 100 Messungen alle tagsüber, dann haben Sie natürlich diese nicht unabhängig voneinander. Und was Sie nicht drin haben, sind nicht zufällige Fehler. Wenn Ihr Messgerät falsch geeicht ist und dass die ganze Zeit ein Wertanzeig, der um 0,1 daneben ist,
20:02
ist jeder von diesen 100 Märten um 0,1 daneben. Da können Sie so oft messen, wie Sie wollen. Diese 0,1 kriegen Sie niemals raus. Also man darf sich nicht zu viel von dem Mehrfachmessen versprechen. Ein paar Mal messen, 10 Mal messen, ist vielleicht noch okay, aber alles darüber hinaus bringt nicht wirklich etwas.
20:22
Jetzt bin ich nicht ganz zur Normalverteilung gekommen. Wenn man diese Idee jetzt weiter treibt, Mittelwerte bilden, kommt man zur Normalverteilung. Wenn man sich anguckt, wie sich denn so ein Mittelwert verteilt, sieht man, dass sich der Mehr und Mehr in Richtung dieser Glockenkurve zieht.
20:44
Mal ich vielleicht zumindest noch mal gerade auf. Am Anfang haben Sie irgendwelche fürchterlichen Verteilungen. Wenn Sie nur einmal messen, hier ist vielleicht der Wert, den Sie haben wollen, 3,14. Und hier ist vielleicht dann, machen wir es mal so,
21:01
hier ist vielleicht 3,0 und hier hinten ist irgendwo 3,5. Sie haben vielleicht zum Beginn so eine Verteilung. Und wenn Sie jetzt anfangen, Mittelwerte zu bilden, wird sich das Mehr und Mehr auf eine immer schärfere Glockenkurve hinziehen. Das ist dieser zentrale Grenzwertsatz.
21:21
Und die Glockenkurve, die dann entsteht, ist die Normalverteilung. Die gucken wir uns dann nächstes Mal an.