Praktische Anwendungsbeispiele - Den Gorilla vor lauter Hypothesen nicht sehen
This is a modal window.
Das Video konnte nicht geladen werden, da entweder ein Server- oder Netzwerkfehler auftrat oder das Format nicht unterstützt wird.
Formale Metadaten
Titel |
| |
Serientitel | ||
Anzahl der Teile | 79 | |
Autor | 0009-0004-1811-9699 (ORCID) | |
Lizenz | CC-Namensnennung 4.0 International: Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen. | |
Identifikatoren | 10.5446/65497 (DOI) | |
Herausgeber | ||
Erscheinungsjahr | ||
Sprache | ||
Produktionsjahr | 2023 | |
Produktionsort | Heinrich-Heine-Universität Düsseldorf |
Inhaltliche Metadaten
Fachgebiet | ||
Genre | ||
Abstract |
| |
Schlagwörter |
12
17
18
34
36
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
56
58
59
61
63
66
67
68
69
71
74
75
78
79
00:00
MittelwertKennzahlDurchschnitt <Mengenlehre>Kategoriale DatenDatenanalyseEckeDatensatzDatentypTabelleProzentzahlBalkenGroßrechnerDiagrammTor <Netzwerk>Statistische HypotheseMedianwertmakeSoundverarbeitungJSONXMLComputeranimationVorlesung/KonferenzBesprechung/Interview
09:38
YouTubeComputeranimationXML
Transkript: Deutsch(automatisch erzeugt)
00:06
In diesem Video wippen wir uns zunächst noch einmal dem arithmetischen Mittelwert und dem Median und veranschaulichen anhand von Beispielen, wann welche von diesen statistischen Kennzahlen sinnvoll eingesetzt werden kann. Dann illustrieren wir, warum wir häufiger Autos und seltener Ziegen gewinnen können,
00:23
wenn wir Wahrscheinlichkeiten richtig verstehen und berechnen. Außerdem zeigen wir am Beispiel eines Experiments, warum es so wichtig ist, sich immer mit den Daten, die man analysieren möchte, zu beschäftigen, sich diese gründlich anzuschauen und beim wissenschaftlichen Arbeiten nicht immer völlig hypothesengeleitet vorzugehen.
00:47
Macht es eigentlich immer Sinn, Daten mit statistischen Kennzahlen zu analysieren? Ganz klar nein. Wir schauen uns mal zwei Beispiele an. Diese sind inspiriert von der Vorlesung Calling Bullshit von Karl Bergstrom und Jevin West im Frühjahr 2017 an der University of Washington.
01:04
Hier sehen wir eine Umfrage vom Institut für Demoskopie Allensbach zur eigenen Lieblingsfarbe. Im Jahr 2001 wurden dazu in Deutschland 2000 Menschen ab 16 Jahren befragt. Warum hier nicht die Gelegenheit genutzt wurde, die Balken im Diagramm in den
01:21
entsprechenden Farben einzufärben, bleibt wohl ein Rätsel. Wir sehen also zum Beispiel, dass zwei von fünf Menschen also 40% blau als ihre Lieblingsfarbe bezeichnen. Außerdem beliebt ist die Farbe rot, die immerhin die Lieblingsfarbe von 19% der Befragten ist, dicht gefolgt von grün mit 18% und schwarz mit 16%.
01:43
Was auch auffällt, offensichtlich gab es Mehrfachnennungen, denn die Prozentzahlen ergeben aufsummiert mehr als 100. Das liegt wohl daran, dass die Frage als offene Frage formuliert war. Was ist, wenn wir diese Umfrage nun mit statistischen Kennzahlen analysieren möchten? Nehmen wir den arithmetischen Mittelwert.
02:01
Können wir die durchschnittliche Lieblingsfarbe der Befragten berechnen? Wie soll das gehen, wenn wir keine Zahlen, sondern Farben gegeben haben? Die Farben mischen? Das macht natürlich nur wenig Sinn. Wir können in diesem Fall einfach keine sinnvolle Aussage treffen. Wir müssen auf den Datentyp achten und Mittelwerte sind für kategoriale
02:21
Daten in der Regel nicht geeignet. Aber auch in anderen Situationen müssen wir genau überlegen, welche statistischen Kennzahlen Sinn machen. Wenn wir uns zum Beispiel das durchschnittliche Einkommen in einer Stadt oder einem Land mit wenigen, aber sehr reichen Milliardärinnen angucken, dann wird der arithmetische Mittelwert viel höher sein als die meisten Einkommen in der Realität.
02:42
Überlegen wir uns dazu ein kleines Beispiel. Stellen wir uns mal vor, wir machen eine Umfrage in der Düsseldorfer Innenstadt. Wir begegnen vier Menschen, die uns ihr Jahresbruttogehalt mitteilen. 20.431 Euro, 48.560 Euro, 56.192 Euro, 81.712 Euro.
03:05
Das ergibt ein Durchschnittsgehalt von 51.724 Euro. Jetzt liegt noch eine Person von der Kö um die Ecke und berichtet von einem Jahresbruttogehalt von 226.500 Euro. Das erhöht den Durchschnitt drastisch auf 86.679 Euro.
03:25
Um ein realistischeres Bild zu bekommen, schauen wir uns hier dann besser den Median an. Der beträgt nämlich 56.192 Euro. Wir haben jetzt gesehen, wann uns statistische Kennzahlen einen falschen
03:42
Eindruck vermitteln können oder unintuitiv sind. Aber wie sieht es mit Wahrscheinlichkeiten aus? Diese begegnen uns allein im Alltag schon ziemlich oft. Zum Beispiel, wenn wir in der Wetter-App checken wollen, wie hoch die Regenwahrscheinlichkeit gerade ist. Oder wenn uns beim Fußball schauen, mal wieder mysteriöse Torwahrscheinlichkeiten angezeigt werden.
04:04
Das war ein Hundertprozentiger. Ein sehr berühmtes Beispiel dafür, dass Wahrscheinlichkeiten manchmal nicht ganz so intuitiv zu verstehen sind, ist das sogenannte Ziegenproblem, auch bekannt als Monty Hall Problem.
04:21
Monty Hall war Host der US-amerikanischen Spielshow Let's Make a Deal. Die nicht mehr ganz so jungen unter euch kennen vielleicht noch das deutsche Äquivalent Geh aufs Ganze. In dieser Show finden sich Kandidatinnen unter anderem in folgender Situation wieder. Es gibt drei Tore, hinter denen sich einen Hauptpreis, sagen wir ein Auto, und zwei Trostpreise verbergen,
04:43
sagen wir Ziegen, daher der Name Ziegenproblem. Nun sollen sie eines der drei Tore auswählen, von dem sie denken, dass sich dahinter das Auto befindet. Dieses wird nicht geöffnet, aber der Host, der weiß, was sich hinter den Toren befindet, öffnet stattdessen eines der beiden anderen Tore. Dort steht eine Ziege.
05:02
Jetzt wird den Kandidatinnen vom Host die Option gegeben, das Tor noch einmal zu wechseln. Was würdet ihr in der Situation tun? Was glaubt ihr, erhöht es eure Chancen auf den Autogewinn, wenn ihr das Tor wechselt? Viele Menschen würden intuitiv sagen, dass nach dem Öffnen des Tors mit der Ziege die Chancen 50-50 stehen und es unerheblich ist,
05:23
ob man wechselt oder nicht. Das ist aber wahrscheinlichkeitstheoretisch betrachtet falsch. Hier müssen wir allerdings sehr vorsichtig sein, weil es ganz viele Annahmen in dem Modell gibt, die unklar sind und klar definiert werden müssen. Zum Beispiel, ob der Host immer das Tor mit der Ziege öffnen würde,
05:40
ob er den Wechsel allen Kandidatinnen anbietet und so weiter. Wir nehmen für unser Beispiel in beiden Fällen Ja an. Die richtige Antwort ist, dass ein Tor wechselt, tatsächlich die Wahrscheinlichkeit verdoppelt, das Auto zu gewinnen. Wir können das am besten nachvollziehen, wenn wir mal alle möglichen Fälle durchgehen. Dazu nummerieren wir die Tore von 1 bis 3.
06:02
Wir nehmen OBDA ohne Beschränkung der Allgemeinheit an, dass eine Kandidatin Tor 1 gewählt hat. MathematikerInnen sagen das gerne, um auszudrücken, dass wir uns jetzt nur einen von drei Fällen anschauen, weil die anderen beiden Fälle, Kandidatin will Tor 2 oder Tor 3, analog behandelt werden können.
06:21
Jetzt gibt es drei Möglichkeiten. Erstens, das Auto ist hinter Tor 1. Hinter Tor 2 und Tor 3 befinden sich jeweils eine Ziege. Der Host öffnet ein beliebiges Tor mit einer Ziege. Die Kandidatin gewinnt beim Nichtwechsel und verliert beim Wechseln. Zweitens, das Auto ist hinter Tor 2.
06:41
Der Host öffnet Tor 3 mit einer Ziege. Beim Nichtwechseln behält die Kandidatin die Ziege. Beim Wechseln gewinnt sie das Auto. Und Nummer 3, das Auto ist hinter Tor 3. Der Host öffnet Tor 2 mit einer Ziege. Beim Nichtwechseln behält die Kandidatin die Ziege. Beim Wechseln gewinnt sie das Auto.
07:02
Die Kandidatin gewinnt also in einem von den drei Fällen, wenn sie bei Tor 1 bleibt, gewinnt aber in zwei Fällen, wenn sie wechselt. Daher beträgt die Wahrscheinlichkeit, das Auto beim Nichtwechseln zu gewinnen, 1 Drittel. Und das Auto beim Wechseln zu gewinnen, 2 Drittel.
07:25
Jetzt möchten wir euch noch ein Experiment vorstellen, das an der HHU durchgeführt wurde. Hintergrund war dabei die Frage, ob wir beim Analysieren von Datensätzen ein ähnliches Phänomen beobachten können, wie bei einem Experiment zur selektiven Aufmerksamkeit. Das Ende der 90er-Jahre
07:41
von Psychologen in Harvard durchgeführt wurde. Dabei wurde über 200 StudentInnen unter anderem ein Video gezeigt, in dem sie sich darauf fokussieren sollten, wie oft ein Basketball zwischen einem Team hin und her gespielt wurde. Mitten im Video lief ein Mensch im Gorillakostüm durch das Bild und klopfte sich auf die Brust. Tatsächlich bekam das circa die Hälfte der StudentInnen nicht mit,
08:03
weil sie so konzentriert auf ihre Aufgabe waren. Martin Lärcher von der HHU und sein Co-Autor Itayanae stellten sich in ihrem Experiment die Frage, ob dieses Phänomen auch auftritt, wenn sie StudentInnen an der HHU die Aufgabe geben, einen Datensatz zu analysieren. Was diese nicht wussten,
08:21
es gab zwei verschiedene Aufgabenstellungen. Eine Gruppe sollte drei vorgegebene Hypothesen testen. Die andere Gruppe wurde nur gefragt, was sie aus dem Datensatz schließen können. Das Interessanteste an diesem Datensatz, wenn man ihn visualisiert, d.h. die beiden enthaltenen Features grafisch abbildet, ergibt sich aus den Datenpunkten das Bild eines winkenden Gorillas.
08:43
In der Tabelle können wir sehen, dass nur ungefähr ein Viertel der StudentInnen mit der Aufgabe, drei Hypothesen zu untersuchen, den Gorilla entdeckt haben, also sich die Daten genau angeschaut haben. In der zweiten Gruppe ist der Anteil deutlich höher. Somit wurde auch bei der Datenanalyse ein Effekt der selektiven Aufmerksamkeit nachgewiesen.
09:01
Wir sollten uns das also immer wieder bewusst machen und aktiv darauf achten, dass wir unsere Aufmerksamkeit nicht von einer der wichtigsten Dinge ablenken, den Daten. Diese zu visualisieren und sich genau anzuschauen, ist immer eine gute Idee. Außerdem sollten wir nie zu voreingenommen und zu stark von Hypothesen geleitet
09:20
an Forschungsfragen im Allgemeinen und an die Datenanalyse im Speziellen gehen und immer Raum für kritisches Denken, neue Ideen und Kreativität lassen. Alles natürlich trotzdem in Übereinstimmung mit guter wissenschaftlicher Praxis. Verliert also bitte nicht den Gorilla vor lauter Hypothesen aus den Augen.