29.03 Schätzung der Varianz
This is a modal window.
The media could not be loaded, either because the server or network failed or because the format is not supported.
Formal Metadata
Title |
| |
Title of Series | ||
Number of Parts | 203 | |
Author | ||
License | CC Attribution - NonCommercial - ShareAlike 3.0 Germany: You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal and non-commercial purpose as long as the work is attributed to the author in the manner specified by the author or licensor and the work or content is shared also in adapted form only under the conditions of this | |
Identifiers | 10.5446/9928 (DOI) | |
Publisher | ||
Release Date | ||
Language | ||
Producer |
Content Metadata
Subject Area | |
Genre |
Mathematik 1, Winter 2010/2011203 / 203
1
3
5
6
8
10
11
12
14
15
19
21
22
23
25
30
31
35
37
38
40
43
45
49
50
52
53
54
56
66
69
74
75
81
82
88
89
91
96
100
102
105
106
107
108
111
112
113
114
116
117
118
120
124
126
132
134
135
136
138
143
146
149
155
156
158
159
160
165
166
167
168
169
171
174
175
176
178
179
180
181
183
185
186
189
190
191
193
198
199
203
00:00
Sample (statistics)MeasurementAverageEstimationEstimatorSquareStandard deviationExpected valueVarianceStreuung <Stochastik>Computer animation
02:03
AverageSample (statistics)Expected valueSquareComputer animation
02:24
Expected valueSquareVarianceAverageLimit of a functionSample (statistics)EstimationComputer animation
04:09
Sample (statistics)MeasurementMittelungsverfahrenExpected valueAverageEstimationComputer animationDiagram
06:58
AverageExpected valueCubeMittelungsverfahrenSample (statistics)Computer animationDiagram
08:01
MeasurementMittelungsverfahrenSquareAverageExpected valueSample (statistics)Ende <Graphentheorie>Binomische FormelSign (mathematics)Term (mathematics)Lösung <Mathematik>AgreeablenessEstimatorDirection (geometry)VarianceDiagramComputer animation
13:11
SquareGradientExpected valueComputer animation
14:35
Expected valueRandom variableMatrix (mathematics)Product (category theory)Computer animation
15:22
Random variableExpected valueMittelungsverfahrenComputer animation
15:54
VarianceExpected valueSample (statistics)SquareMittelungsverfahrenEstimationRandom variableMeasurementComputer animation
18:08
Mach's principleMittelungsverfahrenMeasurementSquareExpected valueSample (statistics)VarianceVapor barrierComputer animation
18:32
Sample (statistics)Expected valueEstimationMittelungsverfahrenMeasurementFactorizationEnde <Graphentheorie>AverageVarianceStandard deviationSquareLinieNumberCurveComputer animation
21:14
MeasurementPer milComputer animation
21:35
MeasurementTerm (mathematics)FactorizationAverageSample (statistics)VarianceStandard deviationComputer animation
22:26
VarianceStandard deviationSample (statistics)Nichtlineares GleichungssystemEstimationComputer animation
23:26
Sample (statistics)MittelungsverfahrenExpected valueStandard deviationEstimationVarianceMeasurementStatisticsComputer animation
24:50
AveragePhysical quantityEstimationPhysikExpected valueOutlierMeasurementDiagram
25:38
OutlierMedianDirection (geometry)Physical quantityStatisticsRobuste StatistikDiagram
Transcript: German(auto-generated)
00:02
Die Schätzung der Varianz und damit die Schätzung der Standardabweichung. Wie breit ist meine Verteilung? Wo bin ich denn hier? Den Erwartungswert, also typischerweise, indem man einfach so und so oft misst und den Mittelwert bildet, den Mittelwert der Stichprobe.
00:23
Aber wie kann ich denn erfahren, wie weit das streut, was ich da gemessen habe? Das wäre die Schätzung der Varianz. Man probiert es ähnlich. N mal messen, steht im Text,
00:41
N mal messen, gibt mir X1 bis Xn als Resultat. Und jetzt versuche ich aus diesen N-Messungen die Streuung zu schätzen. Was man machen könnte wäre Folgendes.
01:04
Das ist die sogenannte unkorrigierte Stichproben-Varianz. Das hört sich monströs an. Unkorrigierte Stichproben-Varianz. An dem Wort unkorrigierte merken Sie schon, da ist etwas faul, das wird man typischerweise nicht machen. Stichproben-Varianz.
01:27
Die ist Folgendes. Ich bestimme den Mittelwert aus denen und mache das, was ich bei der Varianz mache, aber nun mit dem Mittelwert.
01:40
Plus X2 minus Mittelwert, Quadrat plus und so weiter, plus, das ist immer ein Minuszeichen geworden, plus und so weiter, plus Xn minus den Mittelwert der Stichprobe durch N. So etwas könnte man probieren,
02:01
um die Varianz zu schätzen. Also dieses X quer wäre jetzt der Mittelwert der Upsilon. Ich habe immer die falschen Tasten. Das hier wäre jetzt der Mittelwert der Stichprobe.
02:24
Eigentlich müsste ich ja hier rechnen der gemessene Wert minus Mu, den echten Erwartungswert Quadrat, plus den nächsten gemessenen Wert minus Mu, den Erwartungswert Quadrat und so weiter und so fort. Das müsste ich eigentlich rechnen, hier mit dem echten Erwartungswert. Dann wäre alles in Ordnung.
02:42
Das würde mehr und mehr die Varianz werden. So ist ja die Varianz definiert. Die Abweichung vom Erwartungswert Quadrieren und Mitteln. Also wenn hier ein Mu stünde, dann wäre alles okay, wenn da der Erwartungswert stünde. Das ungeschickte ist, ich kenne den Erwartungswert nicht. Ich habe ja nur meine Messwerte und weiß den Erwartungswert nicht.
03:02
Statt dass ich den echten Erwartungswert nehme, setze ich hier ja den Mittelwert der Stichprobe ein. Das ist ja gelogen. Der Mittelwert der Stichprobe ist ja nicht dasselbe wie der Erwartungswert. Das haben wir eben sogar gesehen. Wie weit liegt der Mittelwert der Stichprobe typischerweise weg vom Erwartungswert? So viel. Das ist der Ärger.
03:21
Wenn hier Mu stünde, wäre das wunderbar. Die übliche Formel, wie die Varianz entsteht, hier von den Grenzwerten entgegen und endlich bilden. Aber hier steht nicht Mu, hier steht der Mittelwert der Stichprobe und der stimmt nicht. Der zieht das Ganze schief.
03:47
Ich kann einmal noch gerade mal diese zwei Kriterien angucken, die man typischerweise hat. Verschätzungen. Ich möchte, dass es immer genauer wird, je mehr experimentlich mache ich. Je größer die Stichprobe ist, umso genauer soll das werden.
04:04
Das funktioniert hier. Wenn Sie immer mehr Experiment in der Stichprobe haben, dann wird dieses X quer sich auch immer mehr an den Erwartungswert annähern und hier steht dann tatsächlich immer mehr, was der üblichen Varianz
04:21
entspricht. Das haut hin. Was nicht hinhaut, ist Folgendes, und das führe ich gleich vor, ist das Zweite. Wenn Sie von dem Ausdruck unten, von der Schätzung unten, den Erwartungswert bilden, kriegen Sie nicht das richtige Resultat. Eben hat das funktioniert. Die Schätzung für den Erwartungswert durch den Mittelwert,
04:42
das haut hin. Da ist der Erwartungswert das Richtige. Wenn ich das hier mache, haut es leider nicht hin. Das wäre jetzt gleich das Experiment hier von den Erwartungswert bilden und gucken, was passiert. Ob das das Richtige wird, ob dieses zumindest im Mittel stimmt. Diese Schätzung wird ja auch mal zu groß, mal zu klein sein. Meine Hoffnung ist
05:02
dann zumindest, dass der Erwartungswert davon stimmt, dass sie im Mittel die Schätzung zumindest das Richtige ergibt. Leider nicht. Kann man sich grob so vorstellen, warum das nicht hinhauen kann? Sehr großer Fall geworden.
05:26
Das wäre der echte Erwartungswert. Und jetzt mache ich ein paar Messungen.
05:42
Die werden ja irgendwie streuen. Wo wird der Mittelwert von diesen vier Messungen liegen? Wenn das meine vier Messungen sind, x1, x2, x3, x4 von mir aus, und ich bilde davon den Mittelwert,
06:02
liegt er vielleicht so, liegt er vielleicht so, x2, der Mittelwert aus diesen vier Messungen. Das ist im Allgemeinen nicht der Erwartungswert. Da haben wir schon sehr viel Glück, wenn wir genau den Erwartungswert treffen. Beziehungsweise die Wahrscheinlichkeit, dass das genau der Erwartungswert ist, ist null.
06:22
Treffe nicht diese Stecknadel im Heuhaufen. Typischerweise liegt der Mittelwert daneben. Und eben haben wir schon ausgerechnet hier, wie weit ich daneben liege im Mittel. Und nun kommt das Ärgernis, dass ich diese Abweichungen von diesem gemessenen Mittelwert betrachte.
06:43
Wie weit ist das x1 weg von diesem Wert? Wie weit ist das x4 weg? Wie weit ist das x2 weg? Wie weit ist das x3 weg? Davon gucke ich mir die Abweichungen an, quadriert und das Mittel. Das ist aber zu gut, weil der Mittelwert ja in den Schwerpunkt gerutscht ist.
07:02
Wenn ich den wahren Erwartungswert nehmen würde, die Abweichungen vom wahren Erwartungswert, das blödsinn, das ist ein weißer Schimmel, die Abweichungen vom Erwartungswert, das Erwartungswert ist immer wahr, Sie nehmen die Abweichungen vom Erwartungswert, dann wird das schlechter. Die werden größer werden.
07:21
Das Mittel der Stichprobe ist ja schon in den Schwerpunkt der Stichprobe gezogen. Die ganzen einzelnen Experimente in der Stichprobe liegen natürlich dichter dran an dem Mittel der Stichprobe als an dem wahren Mittel, als ein Erwartungswert. Das heißt, das, was ich aus der Stichprobe schätze, kann nur zu klein sein. Die Streuung, die ich aus der Stichprobe schätze, kann nur zu klein sein.
07:43
Vielleicht müssen wir das einmal ganz brutal malen. Stellen Sie sich vor, Sie haben echt Pech und kriegen das als Ergebnis. Das könnte ja im Prinzip passieren. Das ist der wahre Mittelwert, der Erwartungswert. Dann könnte ja im Prinzip passieren, dass das Ihre Messwerte sind. Genauso wie im Prinzip, es passieren kann, dass Sie in Würfel viermal
08:02
hintereinander werfen und kriegen viermal die 6. Es kann passieren. Es muss sogar irgendwann passieren. Stellen Sie sich vor, das passiert tatsächlich. Die vier Messungen liegen alle da. Dann ist der Mittelwert Ihrer Stichprobe hier. Die Abweichungen vom Mittelwert der Stichprobe sind allermoderat, aber die Abweichungen vom
08:22
Erwartungswert sind monströs. Das wäre eine extreme Situation. Hier wäre es ein bisschen moderat, aber trotzdem wird die Varianz, die ich hier schätze, dieses Ding hier wird zu klein sein. Das ist immer zu gut, was da rauskommt, weil der Mittelwert der Stichprobe schon in
08:44
und nun rechnet man dann einfach aus, wie viel er zu gut ist. Das ist gar nicht so dramatisch. Das führe ich auch wieder nicht für allgemeine End vor. Das nervt total, das für allgemeine End zu machen. Das führe ich auch wieder nur vor für 2. Was ist, wenn Sie 2 nehmen und mitteln?
09:01
Was passiert dann mit dem Ergebnis? Was wird der Erwartungswert des Ergebnisses sein? Also hier für n gleich 2. Der Erwartungswert von das sieht heftig aus,
09:21
der Erwartungswert von diesem ersten Teil hier x1 minus das Mittel aus 2 Messungen Quadrat plus x2 minus das Mittel aus 2 Messungen Quadrat durch 2. x1 minus das das ist grausam, minus das Mittel aus 2 Messungen
09:41
das Mittel aus 2 Messungen ins Quadrat plus x2. Sie ahnen, warum ich das nicht allgemein für n hinschreibe, sondern nur für n gleich 2. x2 minus das Mittel aus 2 Messungen ins Quadrat und davon den Mittelwert.
10:01
Nicht streichen, sondern nur den Mittelwert. So, daraus den Mittelwert. Nochmal zum Vergleich. Erstes Mal messen, minus Mittel, quadrieren, zweites Mal messen, minus Mittel, quadrieren durch 2, wenn ich es nur für n gleich 2 mal angucke. Erstes Mal, minus
10:21
Mittel, quadrieren, plus zweites Mal messen, minus Mittel, quadrieren durch 2. Und das rechnet man jetzt ein bisschen vorsichtig aus. Das lässt sich extrem viel zusammenfassen. Die 2 kommt erst mal davor. Das ist das Rückentext Nummer 7. Die 2 kommt erst mal davor.
10:42
Also ein halb Mal. Erwartungswert von dem. Wie kann ich den ersten hier, wie kann ich den geschickt schreiben? Also hier vorne habe ich 1x1, davon ziehe ich ein halbes x1 ab.
11:04
Das heißt ich habe insgesamt ein halbes, ich habe insgesamt ein halbes x1. 1 minus ein halbes. Und davon ziehe ich noch ein halbes x2 ab. Ein halb x1 minus ein halb x2 Quadrat ist der erste Term. Hier hinten habe ich ein x2, von dem ich ein halbes abziehe.
11:25
Also x2 halbe. Und dann habe ich noch ein x1 minus halbe abgezogen. Minus x1 halbe Quadrat.
11:44
So weit, so schön. Wenn wir uns das hier genauer angucken. Quadrat a minus b Quadrat plus b minus a Quadrat. Hier steht zweimal dasselbe. Im Quadrat hinten, das ist einfach mit anderen Vorzeichen das, was da vorne steht.
12:03
Was soll ich das einmal darunter mit Schweifklammern schreiben? Hier steht es einfach zweimal x1 halbe minus x2 halbe Quadrat. Hier hinten steht dasselbe, nur andersherum. Das heißt mit negativen Vorzeichen. Minus x2 wird plus x2. Plus x1 wird minus x1.
12:21
Wenn ich quadriere, ist das Minus weg. Die 2 kann ich aus dem Quadrat rausziehen. Wie ziehen Sie da die 2 raus? Die 2 aus dem Quadrat ziehen heißt, ein Viertel raus. Mal die 2, also 2 Viertel mal x1 minus x2 Quadrat.
12:47
Hier können wir kürzen. Den weg und da unten steht die 2. Das macht jetzt insgesamt, da geht es weiter. Das macht jetzt insgesamt, ein Halb mal, ein Halb ist ein Viertel, mal Erwartungswert von x1 minus x2 Quadrat.
13:08
Jetzt kommt wieder binomische Formel. Hier innen drin steht, etwas größer. Hier innen drin samt Quadrat, so, samt Quadrat steht x1 Quadrat minus 2 x1 x2 plus x2 Quadrat.
13:35
So, dass ich insgesamt habe, das ist ein Viertel mal.
13:44
Ist ein Halb verloren gegangen, kann sein. Hier hatte ich ein Halb mal, ein Halb macht ein Viertel. Ein Viertel mal. So, der Erwartungswert von x1 Quadrat, Erwartungswert von x1 Quadrat minus
14:04
2 mal das Produkt der Erwartungswerte plus den Erwartungswert von x2 Quadrat. Oh man, mühsam ernährt sich das Eichhörnchen.
14:26
Ein Viertel. So, der Erwartungswert vom ersten Mal messen, quadrieren und der Erwartungswert vom zweiten Mal messen, quadrieren. Ist hoffentlich einfach zweimal der Erwartungswert. Der Zufall ist größer überhaupt, ich schreibe jetzt einfach mal x.
14:43
Also, die fassen die beiden jetzt zusammen. Erwartungswert einmal messen, quadrieren, ist natürlich dasselbe, als ob sie immer das zweite Mal messen und quadrieren. Die beiden sind dieselbe. Ich sollte den eins weiter vorne machen.
15:01
Die beiden sind natürlich dieselben. Also zweimal der Erwartungswert der Zufallsgröße. Dieser jetzt. Der Erwartungswert. Die Klammer sieht ein bisschen ungeschickt aus an der Stelle. Der Erwartungswert des Produkts der beiden. Irgendeine Idee.
15:23
Das hier gerade mal beim Würfeln. Stellen Sie sich vor, Sie würfeln einmal, gibt eine 3. Dann würfeln Sie nochmal, gibt eine 4. Sie würfeln. Sie beginnen von vorne. Gibt eine 5. Sie würfeln nochmal, gibt eine 5. Sie würfeln nochmal, gibt eine 1. Beim nächsten Mal gibt es eine 2. Sagen wir, damit ist genug und ich teile durch 3.
15:40
Denn das wird nicht Null werden wie eben. Eben wurde das Null, weil da stand die Zufallsgröße minus ihren Erwartungswert. Mal nochmal messen. Minus Erwartungswert. Dann wird es tatsächlich Null. Das hier wird nicht Null werden. Das wird das hier wohl im Mittel werden. Beide mal messen.
16:01
Der erste ist mal größer, mal kleiner als der Erwartungswert. Der zweite mal größer, mal kleiner als der Erwartungswert. Und das unabhängig voneinander. Diese Abweichungen löschen sich weg. Und wir haben zum Schluss tatsächlich den Erwartungswert des einen. Mal den Erwartungswert des anderen. Das müsste man ausführlich begründen. Wird nochmal 5 Veranstaltungen kosten.
16:22
Das lohnt sich nicht. Also der Erwartungswert des einen mal den Erwartungswert des anderen wird das werden. Wenn die beiden unabhängig voneinander sind. Naja, aber der Erwartungswert des einen mal den Erwartungswert des anderen ist schlicht und ergreifend der Erwartungswert dieser Zufallsgröße ins Quadrat.
16:40
Beim zweiten Mal messen hat es natürlich denselben Erwartungswert wie beim ersten Mal messen. Und hier steht noch eine Minus 2 davor. Da steht dann insgesamt 2 Viertel mal den Erwartungswert von x Quadrat minus den Erwartungswert von x Quadrat.
17:04
Was erkennt man nun wieder? Das hier ist die andere Art die Varianz hinzuschreiben. Das ist die Art wie ich die Varianz gut ausrechnen kann. Also wir können einmal sagen Varianz ist von der Idee her die Abweichung vom Mittel quadrieren im Mittel.
17:28
Aber das hatte ich Ihnen schon vorgeführt. Das ist nichts anderes als das Mittel des Quadrats minus das Quadrat vom Mittel. Also steht hier insgesamt haben wir Sigma Quadrat halbe.
17:41
Erinnert sich noch jemand was eigentlich rauskommen sollte. Vorsicht warum ich das gemacht habe, warum ich das überhaupt gerechnet. Ich wollte feststellen ob diese Schätzung hier zweimal messen und dann diese unkorrigierte Stichproben Varianz zu bilden.
18:02
Ich wollte feststellen ob das im Erwartungswert stimmt. Ich wollte wissen ob dieses hier für n gleich 2 im Erwartungswert die richtige Varianz ergibt. Wenn ich das mit 2 mache. Einmal messen minus Mittel von zwei Messungen plus zweites Mal messen minus Mittel der beiden Messungen.
18:20
Quadrat Quadrat durch 2. Ich wollte wissen ob das im Erwartungswert das richtige wird. Eines dieser beiden Kriterien hier stimmt es für immer größere Stichproben immer besser. Geht es gegen den richtigen Wert für immer größere Stichproben und ist der Erwartungswert der richtige. Auch für endlich große Stichproben.
18:41
Das zweite Kriterium wollte ich überprüfen ist der Erwartungswert von dieser unkorrigierten Stichproben Varianz. Ist der Erwartungswert von diesem Ding wirklich die Varianz oder nicht. Und sie stellen fest leider nicht. Es ist nur die Hälfte der Varianz. Das ist ja auch keine große Neuigkeit.
19:02
Dass es kleiner ist zumindest nicht genau um wie viel es kleiner ist. Aber dass es kleiner ist ist ja keine große Neuigkeit. Es ist auf jeden Fall kleiner als die Varianz. Das hat gar keine andere Chance. Hier wissen wir um wie viel es kleiner ist. Nur die Hälfte. Wenn Sie zweimal messen und mit den zwei Messungen schätzen was die Varianz ist,
19:20
haben Sie nur die Hälfte des Originals. Das kann man allgemein machen. Sie ahnen dass das ein bisschen ekliger wird. Man kriegt ein bisschen unschöne Summenzeichen rein. Ich kann diesen Faktor einfach korrigieren. Anscheinend, wenn ich zwei Messungen mache, muss ich das Ergebnis mal zwei nehmen.
19:42
Und dann stimmt es. Bei drei Messungen kommt ein anderer Faktor. Bei vier Messungen kommt ein anderer Faktor. Allgemein ist der Faktor folgender. Und damit hat man dann die korrigierte Stichproben Varianz. Die korrigierte Stichproben Varianz.
20:03
Die heißt dann gerne S für die Nummer 8. S² heißt sie natürlich. Die Standardabweichung ist dann S. S², also nicht mehr Sigma-Quadrat, sondern S². Um zu sagen, hallo, das ist eine Schätzung. Das ist nicht der wahre Wert.
20:21
Das ist das, was wir eben hatten. Mit Verzierung. Einmal messen minus den Mittelwert von N-Messungen. Quadrat plus nochmal messen. Minus den besagten Mittelwert plus und so weiter. Das letzte Mal. Endes Mal messen. Minus besagten Mittelwert. Durch N.
20:43
Und jetzt kommt der Korrekturfaktor. N durch N minus 1. Was ich Ihnen vorgeführt habe, hier, ist für N gleich 2. Für N gleich 2 steht da 2 durch 2 minus 1.
21:01
Mal 2. 2 durch 1. Für N gleich 2 rechnen Sie mal 2. Und da haben wir dann tatsächlich als Mittel von diesem Ausdruck den richtigen Wert. Wenn man sich die Mühe macht, das für andere N durchzurechnen, findet man, das ist der Korrekturfaktor, den man braucht. Mal N durch N minus 1. Je mehr Messungen ich mache, desto besser wird das auch.
21:23
Wenn Sie tausend Messungen machen, ist dieser Korrekturfaktor ja nur noch 1.999. Nur noch 1 Promille daneben. Dann ist es mir auch egal. Bei tausend Messungen heißt das, dürfen Sie den ignorieren und rechnen das, was Sie naiv machen würden. Wenn Sie nur zwei Messungen machen, liegen Sie massiv daneben.
21:40
Wir würden mit dem hinteren Term alleine die Stichprobenvarianz um Faktor 2 daneben schätzen. Da braucht man das schon. Also für wenige Messungen, für kleine Stichproben, diesen Term da vorne nicht vergessen. Das Nette ist, man kann ihn kürzen. Es wird dann sogar noch einfacher. Wir kürzen hier einfach N und N. Und dann steht da die formelsammlungmäßige Formel. Das sieht so aus wie der Mittelwert der Abweichungen vom Mittelwert quadriert.
22:08
Also die Abweichung vom Mittelwert quadriert, plus und so weiter, plus und so weiter. Und hier xn minus Mittelwert quadriert. Aber Sie teilen durch n minus 1. Sie teilen nicht durch die Anzahl, sondern sie teilen durch 1 weniger.
22:22
Dann haben Sie den Korrekturfaktor eingebaut. Das ist die korrigierte Stichprobenvarianz. Das ist das, was man üblicherweise als Varianz der Stichprobe angibt. Wenn man irgendwo was redet von Varianz der Stichprobe, gibt man typischerweise das an. Nicht durch n teilen, sondern durch n minus 1 teilen.
22:42
Und was man als Standardabweichung angibt, ist dann auch keine große Überraschung, einfach die Wurzel daraus, die, ich schraube mir mal in Klammern, weil meist nennt man es dann einfach Stichprobenvarianz und Stichprobenstandardabweichung. Deshalb habe ich hier mal in Klammern die korrigierte Standardabweichung der Stichprobe.
23:12
Standardabweichung der Stichprobe, einfach die Wurzel daraus.
23:20
Es, nicht Sigma, Sigma ist die wirkliche Standardabweichung, die der Grundgesamtheit, wie das so schön heißt, s ist die Schätzung, einfach die Wurzel, aus dem da oben, muss ich jetzt nicht hinschreiben, das kriegen Sie alleine aus, die Wurzel aus dem Ausdruck eben. Das gibt man dann für Stichproben typischerweise an.
23:43
Die Abweichungen vom Mittelquadrieren aufsummieren durch die Anzahl minus 1 und dann die Wurzel. Wenn man sich das genauer anguckt, diese Schätzung hier der Standardabweichung, ist hier eigentlich ein bisschen gelogen, denn die beiden Kriterien hier wieder.
24:07
Wenn die Anzahl der Messungen immer größer wird, okay, dann haut das hin, die Standardabweichung wird die wahre Standardabweichung werden. Aber wenn Sie den Erwartungswert von dieser Standardabweichung bilden,
24:21
stimmt der leider nicht, es stimmt der Erwartungswert von der Varianz. Aber der Erwartungswert von der Standardabweichung wird leider nicht stimmen. Andererseits ist der so fies zu berechnen, der Erwartungswert von der Standardabweichung, dass man sich das auch nicht gibt. Man gibt sich damit zufrieden, der Erwartungswert der Varianz passt und daraus bildet man die Wurzel und nennt das die Standardabweichung der Stichprobe.
24:47
Allerletzte Bemerkung zur Statistik noch an dieser Stelle. Diese Schätzungen hier sind nicht richtig schön, weil die sehr unter Ausreißern leiden.
25:08
Wenn Sie ein paar Messungen machen, so von dieser Art, und haben einen Ausreißer, wenn Sie einfach jetzt den Mittelwert bilden daraus,
25:22
wird der Mittelwert wunderbar nach rechts verschoben sein. Analog werden die ganzen anderen Größen, die man da gebaut hat, verschoben sein. Das macht es nicht sehr schön. Das ist nicht robust, wie man so sagt.
25:41
In der Technik ist das meist nicht so ein Drama, denn wenn Sie so einen Ausreißer haben, fangen Sie wahrscheinlich noch mal an, Ihr Experiment zu untersuchen und fangen von vorne an. In den Sozialwissenschaften muss man mit solchen Ausreißern rechnen. Deshalb finden Sie in den Sozialwissenschaften typischerweise seltener was wie Erwartungswert,
26:01
sondern lieber den Median zum Beispiel. Den hatte ich ja schon vorgestellt. Wenn Sie von diesen fünf Messwerten den Median bilden, Sie geben das Ergebnis an, das in der Mitte von allen liegt, 50 Prozent drunter, 50 Prozent drüber. Welcher der Messwerte wird der Median sein?
26:22
Aus jeder Richtung der zweite. Der hier wird der Median sein. Den Median stört der Ausreißer nicht so sehr. Deshalb nicht wundern, wenn Sie in den Sozialwissenschaften andere Größen sehen. Man braucht da robustere Statistiken, wie das so schön heißt. Eine robuste Statistik, die auch mit Ausreißern umgehen kann.
26:41
Das ist in der Technik nicht ganz so dramatisch, aber behalten Sie das im Hinterkopf. Sobald Sie Ausreißer haben und keine Chance sehen, das Ergebnis zu verbessern, indem Sie Experimenten noch mal richtig machen, sind Sie mit dieser Sorte an Statistik nicht auf dem besten Wege.