Merken

Statistische Maßzahl, Einführung in die Regressionsschätzung

Zitierlink des Filmsegments
Embed Code

Automatisierte Medienanalyse

Beta
Erkannte Entitäten
Sprachtranskript
sie werden er hat ja gerne an der TU Darmstadt up ok dann begrüße Sie recht herzlich
zur heutigen Vorlesung in der Einführung ich wir fangen mal mit der Wiederholung vom letzten Mal an 1. ungern behandelt Umfragen bei einer Umfrage versteht man unter dem sogenannten Sendling war es dass gewisse Untergruppen deren Antwortverhalten von der Allgemeinheit abweicht in der Stichprobe zu häufig vorkommt und daher die Resultate verfälscht werden ein sogenannter Nonresponse beides führt zu einer Verfälschung der Ergebnisse in dem Teile der Befragten deren Antwortverhalten von WhatsApp reicht die Teilnahme an der Umfrage verweigern bei dieser Gelegenheit wird mir ein wenig von Umfrage ich habe auch eine dabei ich hab sicherlich am letzten Mal schon wollte ich nicht auszahlen ich vom vergessen ich würde mal vorschlagen machen eine zufällige Stichprobe sie geben das Malen 4 durch jeder verbinden sich 1 also müssen bis 14 Fernsehen sie dann in der anderen war 17. 1 dann jeder 4. nennt sich und ja sie kriegen's sie geben weil die einfach direkt nach innen weiter jeden sich 1 und sie Verteidiger war irgendwie in diesem Fall brennt wir oftmals man einigermaßen zufällige Auswahl sie müssen bei der Umfrage der einen einzigen Punkt Alkohl Nadelholz setzen dessen Koordinaten sich da hingehen bestimmen wie sie die Geschwindigkeit und die Schwierigkeit der heutigen Vorlesung einstufen also naheliegenderweise machen dass am Ende der Vorlesung mit dem Anfang und dann können sie noch einige R fragen bzw. anderen einfügen ok nächste Runde behandelt haben bei der Grafen grafischen Darstellung eines Datensatzes in einem wollen wiederkommen wird über jeden zugrundeliegenden Intervall ein Balken gezeichnet dessen Höhe mit der Anzahl der Datenpunkte in diesem Intervall übereinstimmt und bei der grafischen Darstellung eines Datensatzes in einem Histogramm wird über jeden zugrunde legen in der Wahl ein Balken gezeichnet dessen Flächeninhalt mit der Anzahl der Daten .punkt mit der mit dem prozentualen Anteil der Daten .punkt in diesem Intervall übereinstimmt der Übergang vom Film Histogramm zum vom Säulendiagramm zum Histogramm wandelt eingehende motiviert dass wir gesagt haben der Menschen mit dem Auge er Flächeninhalte war insofern ist diese Höhe falsch sofern die zugrundeliegenden dabei alle nicht alle gleich lang sind 3. wichtiger Begriff war der Begriff der
Dichte eine dichte ist eine nicht negativ wie wir relative die Funktion mit der Eigenschaft dass der Flächeninhalt zwischen der Extraktion der Funktion gleich 1 ist sie beschreibt eine Datenmenge wenn die prozentualen Anteil der Datenpunkte in jedem in der Intervall ungefähr gleich dem Flächeninhalt zwischen X-Achse und Funktion über diesen Intervall sind und wir andern konkret noch gesehen den sogenannten kann geschätzt bald die Anwendung ist kann sich geschätzt das auf eine Datenmenge ergibt eine dichte die diese Datenmenge ungefähr beschreibt der kann sich die Schätze entsteht durch verallgemeinert um der Formel für das gleitende Histogramm da habe ich Ihnen gesagt beim letzten Mal das konnte man nach auffassen als ein arithmetisches Mittel von einer Vielzahl von dichten die um die einzelnen Datenpunkte zentriert sind und da wollt ich ihn auch Software mitbringen die
softe hab ich ihn mitgebracht das kann ich Ihnen mal kurz
vorführen sie sehen an der Stelle die
Dichte in dem Fall hab ich den sogenannten gern genommen also das ist ein Sprichwort zu 2 pi mal wo super 3 Teile als Funktion von und alternativ würde ich auch noch 1 durch habe mal kaufen und -minus x durch H für haben nix fest und hier hab ich das 4 x gleich 0 9 H gleich 1 geblottet womit dieses 2. Funktion natürlich mit der 1. übereinstimmt das heißt sie liegen übereinander wenn ich jetzt aber bei der 2. Funktion zum Beispiel K von X gleich 2 Sätze und die 1. las sich und H lass ich bei 1 was würden Sie von vermuten wie verändert sich dann diese rote Funktion also wenn ich da dieser wurden Funktion der von wird sich jetzt Graph von minus 2 b ändert sich dann dieses Bild das wird verschiebt sich nach links das heißt der Hoffnung es nach Hawaii wechseln 0 wollen wir sagen ok ich sogar wird hören wir gucken was passiert es verschiebt sich nach rechts weil man sie eben jetzt 2 einsetzen dann kommt der Funktionswert für 0 aus eine Verschiebung war richtig aber in die andere Stadt gut wäre das heißt haben wollten König natürlich auch in der ist einfach X leicht -minus 2 einsetzen wird entsprechen nach links verschieben ok wenn ich jetzt als nativ mit dem aber vielleicht statt H gleich 1 jetzt hat gleich 0 Komma 3 Einsätze was würden Sie vermuten wir verändert sich dann das Bild alles geht und die rote Funktion wie verändert sich diese wenig statt so wie hier K von -minus oder Cafe +plus 2 jetzt 1 durch 0 , dreimal K von 2 durch 0 Komma 3 Viertel Vorschläge die staucht sich wobei immer schwieriges was meinte der Stauchen und Strecken versteht hab ich heute in der betagte gelernt dass ich lange Lehramtsprüfung saß die meisten Schüler habe eine falsche Vorstellung gestochen Strecken ist ich weiß auch nicht was Stauchen und Strecken ist für mich erstochen irgendwie Krach und Strecken Mehr 15 sie ist auch in Clubs und Strecken so vertreten wird also ich würde sagen wir ziehen sie hoch sie wollen sagen sie schieben sie zusammen ok und wir haben beide Rechte die wir uns als nativ könnten wir auch davon gleich 3 einsetzen dann wird eben nach unten gedrückt und auseinander gezogen oder wie auch immer was geht und was man beim letzten Mal gemacht haben dann kann sich die Schätzer zwar eher so Unfall wurde es haarklein war das heißt sie haben der kindliche Scherze sie haben für iX sukzessive die einzelnen Datenpunkte eingesetzt wie sie haben x 1 x 2 x 3 und so weiter habe eine kleine Zahl dann kriegen sie lauter so kleine dichten die um die einzelnen Datenpunkte will konzentriert sind und dann haben sie das arithmetische Mittel über alle diese dichten gebildeten dass der kann welche Schätze hier kann man die Schätze wurde jetzt auch mal vorführen geschickterweise hab ich gleich noch mehr da das sind Daten die stammen vom Hessischen Statistischen Landesamt Mikrozensus aus dem Jahre aus dem Jahre 2002 der 4 Tausend 175 befragte hier wurden sie nach dem Alter gefragt ich ja gleich auch noch Angaben zur Wohnfläche und zur Miete Leistungsquote wir sie sehen jetzt hier ein Histogramm oder das egal ob sie Histogramm oder Säulendiagramm machen bei den derweil alle äquidistant sind aber das ist ein Histogramm von der Altersverteilung und alternativ habe ich auch eine Dichte der sie können kann sich die Schätze an den Wänden und bekommen diese rote Funktion weil das vorführen muss ich Sie natürlich sagen warum es diese rote Funktion viel schöner als dieses Histogramm also irgendwie möglicher motivieren warum machen wir das Mehr sie sehen zum Beispiel bei diesem Histogramm da war dieser starke Einbruch von 40 nach 50 oder von 40 noch 45 wird dann können sich fragen ist dieser starke Einbruch auch in den Daten real vorhanden Schwede das irgendwas was wieder oder nicht während bei der kann sich die Schätze sehen Sie da ist ein ich keiner erprobte Affen Abfall das kam mir das liegt nicht an der 40 irgendwie wir das es war hier schon relativ runter aber hier auch ungefähr genauso auf das war mehr ein Zufall aufgrund der Einteilung in die einzeln 3 ok ich mach mal weiter wir haben als nächstes die 1. Schätzungen von der Wohnfläche also da würden die Leute gefragt wie groß ist die Wohnfläche in der Sie wohnen sehen schwankt von ja etwas über 0 Quadratmeter bis 100 75 so ungefähr sie würden hier ungefähr vermuten ja der höchste Wert legt so bei ja was ist das 60 70 sie können alternativ auch wieder ein kann nicht sicher zur dazu sich angucken dann sehen Sie diese Orte Funktion und was jetzt etwas Schöneres sehen ist sie könnten etwas schöner sehen wo genau es diese Lage des hoch .punkt und das dann irgendwie interpretieren sie können sich auch noch überlegen spielt dieser kann hier eine Rolle also das ist ja nicht nur tun und unterfällt hier fest aber tun aber hier noch hier ist noch mal ist der Abfall geht nur kurzfristig zurück 3. Sache mit Belastungsquote das heißt er war glaube ich wie sie durch Nettoeinkommen so ungefähr und in Prozent und auch da haben sich hier ein Histogramm und hier haben sie eine dichte und auch da sehen Sie noch mal an der an der Dichte denn etwas besser oder ist die maximal Stelle ist oder Sie können sich ja noch überlegen hat dieser kleine wurde hier noch irgendeine Bedeutung andere Sache die vorführen wollte weil Einfluss der Bandbreite noch mal das 1. fürs Alter sie sehen es hier mit einer sehr kleinen Bandbreite in Rot dann eine große Bandbreite im Grünen und die eigentliche Bandbreite in blau die Fohlen verwendet habe um wieder zwischen dann sehen Sie wenn die Bandbreite ist sehr klein ist bekommen Sie eine Vielzahl von lokalen Maxima und Minima und eine sehr stark schwankende Funktion wenn die Bandbreite sehr groß ist dann wird mehr oder weniger alles weg geglättet und so mittleren Wert schmiegte sich eher wenn man da sie auf Grund das Histogramm seines erwarten würden letzte Sache die hinfort vorführen wollte war diese Schätzung einerseits mit dem naiven gern anderseits Ausgaben naiver kann einfach die Indikatorfunktion zu dem in der -minus 1 1 getan durch Inhalt werde mit einer eben gern wird die Schätzungen leben und bestätigt das heißt Sie sehen da so eine Vielzahl von Sprung stellen die Sie hier nicht wirklich der Sprung stellen wahrnehmen weil sie senkrecht nach oben durch gezeichnet sind als Linien aber eines ist der Vielzahl von Funkstille während wenn Sie den Ausgang man sie das Ganze eben etwas Schüler aus ok an Sie fragen weit fragen und Art zum Dämmerlichte Schätzung vielleicht doch ich kann in dieser auf der die ich je benutzt hat alles ist er das wird mit EU gemacht 1. freiheitliche Statistikteil geht da kann ich Ihnen einen Link reinsetzen und finden in Zug an und ich kann auch das entsprechende Softwarepaket was hier verwendet wurde dann Tukane nicht hochladen können Sie das mal selber ausprobieren können Sie noch mit also da stehen ich habe sie nur 3 Variablen aus dem Mikrozensus will präsentiert es gibt aber stehen aber einige mehr drin ist ab 8 oder 9 wir können sich das Ganze auch noch angucken alles glatt 7 buchen an können Sie es runterladen und wieder interessiert sind ok dann
kommen wir zu Abschnitt 3 3 statistische Maßzahl Platte sich immer erst mit statistische Maßzahlen was sich einen Datensatz in wenigen Zeilen zusammen das heißt sie haben Datensatz bestehend aus 100 Zahlen Tausend sollen 10 Tausend an was auch immer und sie wollen diese Zahlen in wenigen Zahlen zusammenfassen um einen Überblick zu bekommen hat diese wenigen Zeilen das ist klar aber werden sie natürlich Informationen verlieren als komprimieren des Datensatzes in wenige zahlen es gibt 2 Arten von statistische Maßzahlen das 1. sind Lage Maßzahlen die schauen sich an oder beschreiben in welchem Bereich der Zahlengerade die Werte oder genauer die Mittel der Werte liegt 2. 10. Streuungsmaß zahlen die geben an wie groß ist der Bereich über den sich die Werte im Wesentlichen erstrecken bzw. meistens auch so formuliert wie stark schwanken die Werte und den mittleren Wert im folgenden sei klein x
1 bis 3 ist in den Messreihe wir
betrachten das Beispiel eines von oben monatliche Nettoeinkommen Alleinstehender im Jahr 2002 also bei meinem Beispiel mit oben ist immer die Vorstellung dass ich eigentlich aus einer langen Papyrusrolle SSH schreiben und die immer so weiter drehen meines oben einen einig und man früher X 1 es sei 100 Personen waren diese 100 zahlen aus dem Mikrozensus glaub war vom Statistischen Bundesamt nicht vom Hessischen Statistischen Landesamt X 1 welche 16 70 x 2 der 14 Uhr 40 und x 870 die
der Größe nach aufsteigend sortiert und Werte sei X unten in Klammern 1 x und in Klammer 2 bis X und in Klammer in das heißt wenn ich die 100 zahlen
ordnete der Reihe nach dann ist X und nimmt aber einst die kleinste Zahl 200 sehen X unten klarer 100 ist die größte Zahl ist 6 Tausend 820 wenn ich werde man noch mal zurück wenn
Sie hier gucken die kleinste Zahl sehen 210 wir haben sich hier und die größte war 6 Tausend 820 er wird auch irgendwo auftauchen und sie sehen schon allein
dieses durch diese sortieren sehen Sie natürlich ein bisschen mehr Struktur in den oder sehen Sie ein bisschen mehr über welchen 30 die Daten erstreckt ok so weit so Bezeichnungen
wir fangen wir an mit Lage Parametern das einfachste Lage Parameter kennen Sie alle von Durchschnittsnoten der Schule ist es empirische arithmetische Mittel das heißt sie nehmen alle Werte summieren auf und 1 durch die Anzahl der Werte bei den monatlichen Nettoeinkommen oben war X quer gleich 1223 ach so sollte sozusagen zwang die monatliche Nettoeinkommen alleinstehender vor bei den Datensatz waren das monatliche Nettoeinkommen insgesamt von das die zufällig ausgewählt werden das nicht nur Alleinstehende deswegen sind die hier natürlich niedriger also das durchschnittliche monatliche Nettoeinkommen bei der Stichprobe war und gleich 12 23 problematisch sind diese ist dieses Bildung des Durchschnittswertes bei nicht reell Messgrößen oder falls Ausreisende Stichprobe vorhanden sind nicht real Messgrößen ja also diese Addition und durch Teilen gegeben davon aus dass eine reelle Zahlen sind zum Beispiel bei dem was sie aus der Schule kennen Durchschnittsnoten das ist eigentlich gar nicht unbedingt sinnvoll ein empirisches allmähliches Mittel zu bilden weil Noten werden zwar ordinal aber nicht unbedingt für L und dann macht eigentlich keinen Sinn dass die so Unterschied von 4 nach 5 dass der sich aus Unterschied von 1 nach 2 also es ihm eigentlich der gleiche Abstand ist deswegen der da eigentlich so ein empirisch so allmählich Mittel gar nicht den vollen und der Ausreißer versteht man einzelne Datenpunkte die sehr stark vom Rest abweichen also stellen sich vor sie hätten wir noch das Gehalt von Herrn Ackermann mit drin den Deutsche Bankchef dann soll das ganze monatliche Nettoeinkommen von 100 Leuten auf einmal ja ich weiß nicht auf 100 Tausend hoch hochgehen oder was durch einen einzigen Daten müssen einsehen Daten .punkt aber es wäre natürlich nicht unbedingt die Mittel also allerdings der besser Durchschnittswert diese Ausreißer können dahingehenden stehen das sind Fehler eben bei der Entstehung des Datensatzes drin war dass ich vielleicht jemand vertippt hat oder sowas aber es kann auch einfach sein das führt aber auch dazu die Ausreise ist einfach ein realer Daten .punkt aber der eben untypischen bestens in diesem Fall ist besser
geeignet der so genannte empirische Median da man Sie einfach den Daten .punkt der in der Mitte liegt die Frage was ist die Mitte werden die Anzahl der Datenpunkte ungerade ist dann sortieren Sie sie Datenpunkte und neben den Daten der genau in der Mitte steht also nehmen Sie an Sie 100 1 Datenpunkte dann gibt es ein 51 größten oder kleinsten Daten .punkt und das 50 links davon und 50 rechts davon bei den betrachten sie als Mittel der das heißt es wer X dann unten in Klammern im +plus 1 halbe wenn n gerade ist schlicht vom Umfang dann haben Sie das nicht also wie von beiden 100 Nettoeinkommen was ist besser vielleicht noch mal zurück bei
100 Nettoeinkommen das sind 100 in jeder Zeile stehen sehen dann können Sie kucken 10 20 30 40 also ich habe den 50. nein hier werden 10 20 30 40 und 50 kleiner ist dann ist der 50. seines 1. 51. und sowohl beim 50. als auch beim 51. sind jeweils 50 kleiner gleichen 50 größer gleich und den Fall nehmen Sie den Mittelwert von den beiden wir hatten das heißt diesen die beiden Werte auch noch gleich beides mal 1200 sehen das heißt das würde der Median der R 1200 C
der nochmal vor das heißt in dem ein halt mal X in Klammern als Index +plus in Klammern als Index Inhalte bis 1 um bei den monatlichen Nettoeinkommen bekommen sie als Milliarden 1200 10 bis 12 14 halt also 12 haben Sie fragen wollte also wenn Sie so überlegen Bein empirischen arithmetischen Mittel habe ich vorhin gesagt wir haben Probleme mit Ausreißern ich nehme das Gehalt von Herrn Ackermann dazu das ganze wenn ihre staatliche Mittel verändert sich drastisch was passiert hier mit Ausreißern wenn sie den Jahren nehmen wenn sie mit annehmen also was passiert wenn sie ein einzelnen Daten .punkt mehrere Nullen dranhängen das war er nicht berücksichtigt bzw. es verschiebt sich maximal minimal weil sich vielleicht ein Datenpunkt und ein Held auf die andere Hälfte will geschieht aber im Prinzip können Sie hier fast die Hälfte der Datenpunkte verfälschen oder abändern bis das überhaupt auswirkt so richtig als 1. den Wert dann spricht er davon dass es robust ist gegen Ausreißer ok nächste Sache die ich vorstellen möchte sind Streuung Parameter also die Lage Parameter haben Grad der Durchschnittswert und dir an die Mitte beschrieben von Datenpunkten Streuung bewährte Parameter beschreiben die stark schwankt und die mit der das Erste ist die empirische Spannweite oder Variationsbreite das wir einfach größer werden .punkt -minus kleinste baden .punkt also gibt an wie groß ist der oder wie groß der Bereich über den sich die Daten von der Strecke bei einem monatlichen Nettoeinkommen Datenfunk bei 6 Tausend 820 kleinste 2. 210 sie nehmen die Differenz der irische Spannbreite ist 6 Tausend 610 natürlich haben Sie dabei auch ein großes Problem mit mit der mit Ausreißern sobald sie ein Ausreißerin haben verändert sich ihre Spannweite 2. Sache können sie sich kommen können sie so genannte empirische Varianz da gucken sich den mittleren quadratischen Abstand von den Datenpunkten zu dem Durchschnittswert empirischen arithmetische Mittel an das heißt C berechne sind ja Schaden ethische mittelbar vor nix mehr sie indes von jedem einzelnen Daten .punkt ab ihren die Differenzen zu mir und das Ganze auf und zahlen dann ja im Prinzip naiv und Sie sagen sie teilen durch die Anzahl der Datenpunkte des wir sie teilen wir aber durch 1 durch ein -minus 1 der Grund warum sie einst durch 1 1 nehmen statt eines durch N bis wer gleich argumentieren dass diese Zahlen die Sie hier aufaddieren ein nicht nur in es einst Freiheitsgrade haben Honig in Freiheitsgrade 1 oder anschauliche Grund der formalen und werden sie am Ende von der Vorlesungen beim Statistiken Anteil zur mathematischen Statistik bestellen was heißen Freiheitsgrade der Freiheitsgrade sowas wie wie viele Sachen darin einig variieren können ok was meine ich damit ich mach mal ein bisschen weiter der Vorfahrt eines solchen ein statt eines durch N bei diese einzelnen Zahlen x 1 1 x wer sie x wir haben ein -minus 1 Freiheitsgrade Begründung wäre wenn ich die alle aufaddieren die 1. Zahl ist die 2. Zahl und so weiter bis die letzte Zahl bei der Addition kann ich die Reihenfolge beliebig verändern sich er die 1. mit ihr alle XI auf dann neugierig alle negativen auf es gibt wenn man x klären muss ich noch abziehen dann komme ich auf die Summe der X Ines in Mali Xperia X quer war die Summe der X geteilt durch einen das heißt hier kommt 0 raus damit sehen sie aber von allen diesen Zahlen können nicht alle gleich beliebig variieren weil eine Zahl ist festgelegt wenn alle anderen verstehen als nehmen Sie an Sie haben die 1. N -minus 1 Zahlen festgelegt dann steht die letzte fest wenn letzte ist einfach -minus wenn die Summe der 1. n wie es einst und deswegen können wir nicht variieren hier eigentlich nicht in verschiedene Zahlen da nur 1 1 ok ich wollte ich als mir so anschaulich was Freiheitsgrade was sie mit Freiheitsgraden meine also Freiheitsgrade der Beschreibung von der Funktion wollen sie meistens meinen wie Parameter haben Sie wo sie variieren können und wir haben Sie im Prinzip keine Parameter natürlich aber ich kann trotzdem sagen wir also diese einzelnen
Differenzen x 1 -minus x für x 2 +plus x der bis -minus x quer können nicht alle möglichen Kombination von n Zahlen annehmen weil die letzte die Differenz ist voll durch die 1. 1 1 festgelegt aber sie machen sich gleich klar die 1. N -minus 1 können Sie eine wird im Prinzip beliebig wählen der ok als sie können sich zum Beispiel vorstellen die 1. N -minus 1 vergeben Sie feste Zahlen vor die sie haben wollen und dann will ich die letzte so XGA gleich 0 ist wenn ich also für x 1 nämlich feste Zahl x 2 eine feste Zahl und so weiter bis Kriegsende dass eines der Feste zahlt die König Philip vorgeben und die letzte will so dass x wir gleich 0 ist das X 1 -minus x für x 2 1 X 4 und so weiter bis Kriegsende S 1 bis X werden die fest vorgegebenen fahren also die kann ich beliebiger vorgeben aber jetzt nicht mehr ok bei einem monatlichen Nettoeinkommen wenn sie es Quadrat rechnen kommen Sie auf ungefähr 709 80 Tausend Euro fragen sobald man ja wenn Sie diesen quadratische Abweichungen wenn sie einem nicht quadratische oder vielleicht noch eine Anmerkung warum schreiben Sie da oben ein Quadrat sie schreiben ein Quadrat hin weil wenn Sie keine wenn sie gar nichts machen würden sie würden einfach nur die Abweichung auf aufaddieren dann gehen sie auf 0 das heißt es ist nicht sinnvoll sie könnten natürlich um Betrag hinschreiben aber mit dem Quadrat kann man noch ein bisschen schöner rechnen wenn sie auch im besten Fall der Vorlesung ok das ganze beschreiten quadratische Abweichung gibt der relativ große Zahl wenn sie eine nicht nicht eine quadratische Abweichung haben wollen wenn wir eine Abweichung wieder Größenordnung und spricht ziehen Sie einfach die Wurzel raus kommen sie auf die empirische Standardabweichung Streuung Wurzel aus den irischen Varianz bei den monatlichen Nettoeinkommen oben wer das 888 Euro und dann können können Sie vergleichen Durchschnittseinkommen oder mehr Jahren auf 1200 sehen dadurch Durchschnittseinkommen war ja ich hab's vergessen 1200 23 Durchschnittseinkommen 888 wir die Streuung da sie eine relativ große Streuung im Vergleich zum Durchschnittseinkommen wenn sie sich des Streuung angucken oder relativ zum empirischen arithmetischen Mittel nehmen sie den sogenannten Variations kurz fragen es wäre die Streuung gezeigt dass es im irischen armenische Mittel bei einem monatlichen Nettoeinkommen der V gleich 0 Komma 7 2 6 sie sehen nicht so recht warum sie das machen sollen er hier ist ein Beispiel der oder eine Sache die ich gleich erwähnen kann einen Vorteil von diesen Variations kommentierenden ist das der Maßstabs unabhängig ist das heißt dieses Gehalt Umrechnen von Euro zum Beispiel in Dollar dann ändert sich natürlich der 10 irischer einmischen Mädel es ändert sich auch die Streuung aber der Variation Score 10 bleibt gleich an den Vorschlag warum also warum reichen erweitern Sie einfach nur dann auch das Verhältnis das Gleiche er richtig also wenn sich überlegen wenn sie denn kurz wenn Sie das empirische altmärkischen Mittel verändern von Euro zu Dollar und wollen sie einfach alle Zahlen mit der festen Zahl multiplizieren und dann wieder auf addieren und durch die Anzahl teilen das heißt das Ganze ist der ganze Durchschnittswert wird sich um diese feste Zahl ändern die empirische Varianz da wird sich die X dieselbe um geschätzte Zahl der ändern bis X quer auch damit dass ich -minus x wird sich um das Quadrat der Zahl ändern können Sie aus der Summe rausziehen und wenn sie dann die das heißt empirische Varianz wird sich um das Quadrat der Zahl ändern wenn sie anschließend wieder die Streuung betrachten Überzug aus ziehen dann ändert sich das eben gerade um die Wurzel aus dem Quadrat also genau um diesen ursprünglichen Faktor und dann sehen Sie dass es ändert sich mein festen Faktor des XP den gleichen festen Faktor der Quotient bleibt gleich also fordern von dem Ding es es ist Maßstabs unabhängig hab noch ein
Beispiel dazu ich betrachte hier 2 Stichproben des Nettoeinkommens alleinstehender und zwar einerseits der alleinstehende Männer und dann der alleinstehenden Frauen im Jahr 2002 und möchte die Einkommen vergleichen wenn ich die empirischen heidnischen Mittel aus Rechte haben wie Männer Mittel von 13 Uhr 50 Mehr Frauen im Mittel von 11 195 das heißt die Männer verdienen mehr als die Frauen ja eine der Sachen die wir die sich mit Blick auf die Frauenförderung als ungerecht ansehen können aber wo sich statistisch groß drüber streiten können woran es liegt also liegt das daran dass die Frauen bei gleicher Qualifikation schlechter bezahlt werden oder liegt das daran dass die Frauen aufgrund ihres Lebenslaufs eine andere Qualifikation haben aber das ist sehr schwierig zu sagen sie können sie jetzt aber auch die Frage stellen ok wir haben hier 2 verschiedene Stichproben die Durchschnittswerte sind verschieden wie sieht es denn mit den Streuungen aus unterscheiden sich hinsichtlich der Steuerung und der Art der Schwankungen um den Durchschnittswert da können Sie empirischen Standardabweichung ausrechnen sie bekommen bei Männern 878 bei Frauen 645 das heißt bei einem ironischen Schwanz war der Frauen wenn Sie jetzt aber den Variations kommerziellen vergleichen eines der beiden Männern 0 Komma 6 5 der beiden Frauen 0 Komma 5 4 das wird erst mal auf angeht so ähnlich wie es ja auch als hier aber man kann jetzt sehen der die empirische Streuung von den Frauen ist 73 Prozent der empirischen Streuung von den Männern aber der Variations kommerziellen wollen Frauen ist 83 Prozent vom Variationskoeffizient von den Männern das heißt zwischen den empirischen Steuerungen ist ein anderes Verhältnis als zwischen den Variationskoeffizient und da steht eben daran weil die beiden auf verschiedenen Maßstäben schwanken in der Schwandorfer in höherem Maßstab als die Frau ok Fragen so weit ob ich noch mal erklären kann woher sie 0 Komma 7 3 1 0 Komma 8 3 hab ich wieder einfach das Verhältnis von Variations korrekt sind oder von der Stange Standardabweichung von der Frauen geteilt durch entstand abweichendes nennen das geht ungefähr gleich 0 Komma 7 3 und wenn ich von den beiden sein da oben VF durch vnd bis den Patienten werde dann komme ich auf 0 Komma 8 3 und das hab ich dann wieder aufgelöst nach RSS beziehungsweise VF es denn dass ich wieder hier umgehen ich werde Steuerungen vergleichen dann kann ich mir die beiden angucken und da kann ich zum Beispiel den Patienten von der Streuung der dafür angucken das war die Idee wir fahren ok dann das
nächste er diese Sachen die ich gerade eben vorgestellt habe zur wie Steuerungsmaßnahmen Maßzahlen waren alle Licht robust gegen Ausreißer alles sehr empfindlich bei Ausreißern werde Hammer alle Fälle Messgrößen vorhergesagt vor verwahrt vorausgesetzt bis auf den die Variationsbreite bei nicht Nichtwählen Messgrößen oder Vorhandensein von Ausreißern ist der sogenannte in Partys Abstand IQ er ist der Viertel größte baden .punkt müssten ein Viertel kleinsten Daten .punkt günstiger ich hat es ist nicht ganz klar was ist der dreiviertel größte Daten .punkt was ist der ein Viertel der kleinste Daten .punkt ich hab immer so geschah schrieben auf kurzen ich nehme einfach den Daten .punkt an 1. Stelle 3 Viertel in und wenn 3 Viertel n keine ganze Zahl ergibt dann und dich auf die nächste ganze Zahl auf das macht dir diese ausklammern diese eckige Klammer hier wo die Ecken oben ist und nicht genauso bei ein Viertel in die gibt es aber andere ausgefeiltere Definition Möglichkeiten wenn Sie es bei einem monatlichen Nettoeinkommen den EQR berechnen Intercord Abstand kommen sie auf 580 -minus 765 das heißt es wir 58 einige verwiesen Ladungen Streuungsmaß stellen sieht sagt er wir stellen sie grafisch stahlen sogenannten Boxplots und das ist das nächste was ich Ihnen vorstellen möchte erprobt wird sieht so aus wie sie haben so sollen Rechberg irgendwo in den reichte waagrechte Linie und dann hat das Recht der noch sollen gestrichelten Linien oder durchgezogene Linie nach oben unten noch waagrechten Linien und einige Datenpunkte sind separat markiert bei dem Rechteck ist es so die diese waagrechte Linie ist genau der medialen also an der Stelle markieren Sie den Median dann die obere Kante von der Box und die untere Kante von der Box 10. 3. bzw. 1. Quartil das heißt der wie gerade eben der Viertel größte Daten .punkt oder ein Viertel kleinste Daten .punkt damit sehen Sie einem Rechteck können Sie den EQR ablesen nämlich das einfach die Länge von dem Recht ist der EQR und dann gibt es eine gerechte Regelung Ausreißer oder eine Heuristik um zu bestimmen sie bezeichnen alle Daten .punkt die größer oder gleich sind als den 3. Quartil +plus 1 Komma 5 Meilen er das heißt sie agieren hier noch 1 , 5 Mal dem EQR alle Daten .punkt wieder drüber drüberlegen sind so ist bezeichnen sie als Ausreißer markieren Sie separat ebenso alle Datenpunkte die unter den 1. VC legen -minus 1 , 5 Mal EQR auch diesen hier als Ausreißer wenn sie sehen übrigens hier stimmt es maßstäblich nicht also ich hätte die 1 weiter oben mal müssen bei wenn sich hier 1 Komma 5 mal hochgehen dann 10 Datenpunkte konnte noch keine Ausreißer damit haben Sie diese Box hier mit dem mittleren wieder mit der weiblichen Linie und Sie haben die Ausreißer bestimmt und jetzt von den verbleibenden Daten punkten schauen Sie sich den größten und den kleinsten an und bis zum größten meinte diese obere Linie bis zum kleinsten diese unterbinden und damit haben sie haben wir haben ob wird komplett bestimmt an der Stelle hier das ist nicht als 2 zu lesen war als ein kleiner gleich dass ein kleiner gleich 1 Kor 5 Mal EQR sein das heißt die Strecke von hier nach hier ist nach Definition kleiner gleich als 1 Komma 5 Mal Guerra weil alle Daten Punkte die ja mindestens den Abstand 1 Komma 5 oder größer ein Abstand von größer als 1 , 5 Mal EQR von diesen 3. Quartil haben die haben sie als Ausreißer markiert von den verbleibenden nehmen sie den größten dann ist der Abstand zum 3. Fall Tieflader gleich das 1 nur 5 genauso hier ist klar Mitleid will die Abstand aber gleich das 1 Komma 5 Mal regulär hier ist gemeint diese Linie ist kleiner gleich als den maximalen Daten .punkt und diese Linie ist größer gleich den oder die Größe große gleich als der minimale Daten .punkt angeht ok fragen wollte fragen der Boxsport bei der Doktor definiert ist also könnten alternativ auch nicht fragen aber sie können auch Ihre Nachbarn fragen wer weiß was ich sagen will schon richtig ok wir machen hier mal Box-Plot können sie sehr schön verwenden auch Daten Mengen zu vergleichen wir vergleichen hier mal die monatlichen Nettoeinkommen von Männern und Frauen mit 2 alle Daten von vorhin mit 2 Boxplots wenn sie jetzt diese Burgplatz betrachten typische Klausurfrage zu dem Thema aber was fällt Ihnen auf oder was können Sie aufgrund dieser Box wird über die Datenmengen aus hab ich im letzten gerade dieses früher Staatsexamen mit genau dieser Abbildung gefragt das heißt Leute haben die Abbildung bekommen und sollten die Datenpunkte die Datenmengen vergleichen anhand dieser beiden Bocksbart was würden Sie da hinschreiben Vorschläge ok sie wurden die unteren und
oberen Grenzen vergleichen und wollen sehen Sie dass die untere Grenze gleich ist eine Obergrenze bei denen wir die 1. Frage ok heute sehen Sie das der war woran sehen Sie dass die Mengen an der Grenze ist als sie kommen diese untere Linie unterhalb von dem Boxen an und diese obere Linie oberhalb von dem Boxen ok Vorschlag dass die 1 Komma 5 Mariko R falsch das nicht die 1 Komma 5 Mal EQR sondern das sind das ist das Minimum Maximum der Datenpunkte die ich nicht als die ich nicht als Ausreißer markiert haben sollen aber sie gucken sich direkt die oberen und unteren Kanten von den Boxen an das heißt die vergleichen ist die 3. Quartil miteinander und die 1. Quartil miteinander und dann sehen Sie die 1. Quartile sind ungefähr gleich und das 3. Quartil ist bei den Männern etwas höher damit sehen sie dass die Männer im oberen Einkommensbereich L etwas mehr oder war es ein Wunder dass da mehr sind den 1. Unterschied besonders auffällt im oberen Einkommensbereich da würd ich voll zustimmen ok weitere Anmerkungen sie sehen dass die Einkommensteuer weil man Größe ist auch dabei diesen zustimmen aber es vor seine Begründung woran sehen Sie das sie sehen das an den gestrichelten Linien ja beherrschte war einer also Probleme den gestrichelten Linie sie könnten argumentieren mit konnten da oben ist die Ausreißer oder auch mit diesen maximal Linien das Problem sind die sind eigentlich nicht robust gegen Ausreißer alle haben sie unter Umständen Problem das heißt immer wenn sie anfangen bei diesem Boxplots allem zu argumentieren mit den ganz oberen Linien oder ganz unterminieren kann es sein das hängt zu stark von ihrem von der zufälligen war Datenpunkte ab das heißt sie haben richtig argumentiert wollen sie müssen sich vor allem konzentrieren auf die eigentliche Box zum Vergleich das andere ist sehr empfindlich gegen Ausreißer es könnte sich stark verändern will ich die gleiche Stichprobe oder nicht einfach noch eine Stichprobe von gleichem Umfang zu überziehen im Prinzip man versucht es zwar hier also Sie haben Sie haben sich diese nicht direkt auf die Ausreise gegangen das ist richtig weil die Ausreise werden darf der schon vor alle Ausreißer wie wollen sie gar nicht versuchen statistischen debattieren aber auch diese Regel für Ausreißer hab ich jetzt und ich habe vergessen zu sagen die Regel für Ausreißer historistisch bekommt von einem Modell der sogenannten Normalverteilung wo solche extremen Datenpunkte eben nur sehr selten vorkommen aber will normalerweise ist müssen die Daten nicht normal verteilt sein beziehungsweise es ja klar dass die Daten hier nicht normal verteilt sind so gesehen ist auch diese Regel mit Vorsicht zu genießen aber wenn sie über Bord Platz wenn sie Box-Plots vergleichen Sie müssen sie vor allem diese robusten ist Sache nehmen und die robusten Sachen wären die beiden fertile und der Median ok Veränderung ok also Vorschlag war 1. Jahren ist beides mal gleich das ist richtig und zweitens wäre sie vergleichen die Lage des mit Milliarden innerhalb der Boxen und dann sehen wir eben der wäre mit Jahren bei den Männern liegt eben nicht in der Mitte der Boxen werden bei den Frauen schon aber diesen Vergleich hatten wir schon so ein bisschen vor mit dem 3. Quartil was sie geben deutlich was in Unterschied sieht man deutlich anhand der Vergleich der 3. Quartil dass die Männer eben zum Teil höhere Einkommen haben als die Frauen und das ist dann mehr gibt dem höheren Einkommensbereich wer im unteren Einkommensbereich ist einigermaßen ähnlich ok ich glaub ich hatte noch Beispiele mitgebracht das war Illustration der Verzerrung der nicht Auswahl eine Umfrage durch Parkplatz in zusammen im Zusammenhang mit einer Umfrage nur ist die Vorlesungen am 26. 10. 0 1 also schon fast 10 Jahre her da hab ich die Studenten am Ende der Vorlesung es war die 1. Vorlesung Förderstatistik Vorlesungen für Wirtschaft Wissenschaftlern ohne dass sich Stuttgart damals ich hab die Studenten am Ende der Vorlesung befragt und zwar einerseits oder im Fragebogen ausfüllen lassen und eine der Fragen was wann C den Hörsaal betreten haben relativ zu wir gehen dass der Vorlesung ist des Beginns der Vorlesungen und das war zum Teil eine Stunde zu früh zum Teil eine Stunde zu spät und siehe dann hab ich unterteilt der pünktlich kamen der unpünktlich kam und ich habe zweitens gefragt nach der Note in der letzten Arbeit in den letzten Mathematik Klausur die Sie geschrieben haben zwar meistens die Abiturprüfungen und dann sehen Sie eben wenn Sie die pünktlichen Studenten angucken dann sehen Sie in die Noten sind besser als beim unpünktlichen Studenten was kein großes ja was sind nicht groß 1. erstaunlich wir alle irgendwie ok und Sie sehen Sie da geben wir können hier direkt die mediale vergleichen oder sie können auch das 1. Wort im 3. Quartil vergleichen dann 2. ich hab noch Interesse gefragt
Fünfer sehr großes Interesse ein zwar sehr kleines Interesse auch das Interesse bei den pünktlichen Studenten am Vorlesung ist am Vorlesen Fach höher als das Interesse bei den unglücklichen Ständen interessant war noch das Öl will dass der obere Bereich also den Bereich den Sie alles nicht sauber interpretieren können statistische einig beides mal völlig gleich war also auch bei den Leuten dieser sehr viel zu spät kam in das Interesse bis zu 5 Wochen es kann einfach dadurch erklären da gab es Leute die kamen wirklich knapp eine Stunde 15 zu spät zur Vorlesung und der so spät noch zur Vorlesung kommt wenn es wirklich interessiert sein ok Fragen noch so weit wenn nicht dann würde ich 5 Minuten Pause machen machen dann um 15 Uhr 21 weiter ok wenn Sie Ihre Unterhaltung so weit
einstellen können herzlichen Dank aber zu Abschnitt 3 4 W kations Rechnung bei der Regression Rechnung haben die eine zweidimensionale Messreihe x 1 y 1 bis X in Y vom Umfang n gegeben das heißt allgemein einig eine gegen sind alle Messreihe mit die Größe eines ,komma nennen wir nur jeder Daten .punkt hat 2 Komponenten Frage wer besteht ein Zusammenhang zwischen den X und den y-Koordinate Beispiel für eine solche Frage wer besteht ein Zusammenhang zwischen der Wochenarbeitszeit im produzierenden Gewerbe und die Arbeitslosenquote in den 16 Bundesländern der BRD im Jahr 2 Tausend 2 da gibt es in der also ist die Frage nach erreichen sie durch eine Verkürzung der Wochenarbeitszeit eine Absenkung der Arbeitslosenquote ja oder nein da gibt es in der Volkswirtschaftslehre 2 konkurrierende Theorien bei der 1. Theorie wird die Arbeit gehen weltweiter Konkurrenz vergeben und deswegen bekommt das Land besonders viel Arbeit das besonders billig produzieren kann und wenn Sie jetzt die Wochenarbeitszeit erhöhen dann werden die Produktionskosten niedriger sie bekommen mehr Arbeit und die Arbeitslosenquote sind deshalb kann mehr Leute beschäftigen bei der 2. Theorie ist die Menge an insgesamt zur Verfügung stehende Arbeit begrenzt und wenn Sie daran die Wochenarbeitszeit erhöhen dann verringern dann erbringen leben weniger Menschen diese Arbeit insgesamt und sie brauchen weniger Beschäftigung und die Arbeitslosenquote steigt und den folgenden wollen wir versuchen ob wir sowas statistische und die eine der beiden Theorien untermauern können dazu nämlich Daten kapieren 16 Datenpunkte zu den 16 Bundesländern der BRD im Jahr 2002 sie können diese
Datenpunkte erst mal grafisch plotten oder darstellen so genannten Sket abwarten steht oder auf deutsch das Streudiagramm da bleiben sie für jeden Einzelnen Garten .punkt ein eine .punkt die x-Koordinate ist die Wochenarbeitszeit die y-Koordinate ist die Arbeitslosenquote und dann bekommen Sie die 16 Datenpunkte hier und bekommen einen 1. Eindruck von der Lage dieser Datenpunkte und was ich jetzt machen möchte bis ich möchte hier ein funktionalen Zusammenhang irgendwie approximativ ermitteln zwischen der x-Koordinate Wochenarbeitszeit und der y-Koordinate Arbeitslosenquote was wir machen ist die da machen ist die so genannte lineare Regression dazu passen eine gerade y Steigung war Maliks Besteigung des an die Daten an das heißt ich Versuche den Verlauf dieser Daten mit Hilfe einer Geraden zu beschreiben und wenn ich diese gerade dann habe dann kann ich leben ich mal zurück gehen wenn ich hier so der gerade durch
gelegt habe beim König zu jeder Wochenarbeitszeit irgendwie sagen was ist die dazugehörige Arbeitslosenquote beziehungsweise den sie seine Funktion gefunden haben Sie könnten auch sagen wie stark wird sich die Arbeitslosenquote verändern wenn sie die Wochenarbeitszeit um 2 Stunden erhöhen oder um 2 schönen absehen also ich fand ja diesen Zusammenhang wollen wir durch Anpassen eines solchen gerade ermitteln eine Möglichkeit dafür dass das Prinzip der kleinsten Quadrate da sehen wir die Steigung A und den y achsen Abschnitt B durch Minimierung von Sommer gleich 1 bis n y wie also y-Koordinate siegen beraten um das -minus es aber +plus B in Klammern und das Ganze zum Quadrat also -minus aber alle x Kunde jeden Datenpunkt ist besteht das heißt wir gucken uns an wie weit ist der an der Stelle x E der Punkt auf der Geraden von dem wahren Daten .punkt entfernt und wenn die Summe der Quadrate aller dieser Aufstände hab wir mal ein Beispiel mit 3 Punkten wir haben x 1 y 1 0 0 x 2 y 2 1 0 x 3 y 3 -minus 2 1 dann bekommen Sie die folgenden also ihrem Kontendaten eingezeichnet die folgenden 3 Punkte das ist der 0 0 das ist der x 12 sind 2 1 1 ist der Xtra Y 3 ds 2 1 und ich habe ihn hier mal 3 Geraden durch gelegt und wenn sich jetzt überlegen was würden Sie sagen welche dieser geraten beschreibt die Datenpunkte gut oder welche beschreibt ist schlecht mit Begründung ich habe auch also die 1. Antwort ich wiederholt mal die waagrechte gerade beschreibt schlecht weil noch ein Punkt beachtet worden die anderen tieferlegen OK weiter und wie ein U-Boot ok die durch gestiegene schlagen denn auch unlogisch weil der weil jedes Jahr immer mehr steigt obwohl die .punkt einig tendenziell eher tiefer legen und die 3. gerade ok die 3. gerade werden ihren Augen die beste Lösungen auch wenn sie keine Punkte direkt beschreibt als 1. waagrechte gerade hatte einen Vorteil zumindest einer der Punkte wird genau beschrieben was sehr genau drauf wäre ok wenn Sie das war vergleichen im Hinblick auf diese Summe der Quadrate der Abstände welche gerade werden dann die beste .punkt ok also er an das war die 3. gerade von links oben nach rechts unten bei bei beiden andern ist in der 1. also ich mir dieser gerade ist der 1. Abstand schon sehr groß wir müssen mal genau überlegen was man nicht einig mit Abstand vorn wäre .punkt so geraten es gibt da verschiedene Möglichkeiten Sohn Abstand und komm zu geraten zu definieren ich könnte einerseits sagen Abstand von dem Punkte der gerade L der geometrischer Abstand einfach rechtwinklig zu geraten untergehen und der Abstand und ich kann sagen ich mach und senkrechten Abstand haben Sie Vorschlag was sich bei diesen kleinste Quadrate Kriterium weil ich meine manche und geometrischen Abstand oder man senkrechten Abstand ich mal den senkrechten Abstand also von vom X-Wert nach oben weil der Abstand ist von den Funktionswerte den .punkt die sind hier noch mal bei der Geraden also mich interessiert eigentlich dieser Abstand dieser Abstand und dieser Abstand und diese 3 Abstände Patriarch jeweils um mir ich auf und das soll möglichst klein sein ich möchte an der Stelle diese senkrechten Abstände haben weil er mir geht es darum diese gerade später als Funktion zu verwenden um den Funktionswert an ich stelle vorhersagen zu können und dann schon gesehen der spielt in der Rolle des Waldes der Funktionswert oder Ibsen werden der gerade eine Stelle -minus 2 entfernt von dem wunderbaren Psion goldene hatte eine Stelle -minus 2 ok fragen sollte fragen sie haben keine Fragen frag ich eben selber also Herr Kohl warum schreiben Sie da ein vertrat haben Sie vielleicht die Antwort an das ist eine Frage ich haben weil dieser wie Antwort ok eine mögliche Antwort wäre für den Mann im Bereich aber ich wiederhole es einfach nur damit dass für die Aufnahme auch haben der eine mögliche Antwort wäre eben sie wollen Ausreißer also einzelne große Abstände werden besonders stark bestraft als kleine das Recht ist eine mögliche Antwort 2. mögliche Antwort man möchte verhindern dass sich Abstände negativen positiven Vorzeichen der ausgleichen das heißt wenn ich kein Beitrag schreiben würde dann könnte es sein die gerade hat einen sehr großen Abstand einer sehr kleinen Abstand aber der die 0 ja gut also keine kalt nichtswürdig natürlich nicht machen aber ich könnte auch alternativ einfach so Müll des Betrags ist Abstand schreiben als Quadrat warum schreibe ich nicht ich betrat und einem vertrat ok so trat der Vertrag von über trat er wendet die kleine Abstände werden noch kleiner gemacht also angesagte großen werde noch größer gemacht und kleine Aufstände kleiner als einziger noch kleiner gemacht ja die Betrags und und es nicht befördern war das heißt wir werden sie nächste Vorlesungsstunde sehen aufgrund der Verwendung des Quadrates hier kann ich die kurz ich relativ einfach ausrechnen wenn ich das nicht hätte kommt ein es diese Funktion raus und sie haben größere mathematische Schwierigkeiten diese Pancho beziehen auch numerischen Schwierigkeiten dessen Anwendung konkret zu berechnen ok doch fragen oder ob das Ganze auch alte die Filterfunktion und Graz machen können Sie können natürlich sagen sie haben ihr Leben Jahres Polynom ich chemische dessen quadratisches Polynom und ich nehme gleichen allgemein Funktion Raum durch ne Funktion auswähle ja das gibt es alles das ist das einfachste die einfachste Idee bin ja Regression mit Lanzen der schätzungsweise 7 Jahre Person heißt dass die Funktion die ich anpasse eigentlich die an ihren Parametern ist und das ist die einfachste lineare Funktion hab ich mir das alles deutlich komplizierter machen es richtig ok wir waren schon da wenn Sie jetzt das für ihn gleich 3 konkret machen Sie haben die 3 Punkte die setzen dann mal einen in dann haben Sie als Junge y 1 -minus in Klammern aber nix 1 bis B )klammer zu und dann die große )klammer zu zum Quadrat +plus den gleichen Ausdruck mit y 2 x 2 +plus den gleichen ausdrucken Gibson 3 x 3 sie können konkret einsetzen das umformen und sie kommt ohne Funktion raus und dann wollen sie eigentlich an B finden sodass piquadrat +plus a +plus b zum Quadrat plus 1 bis 2 mal -minus in Klammern zum Quadrat möglichst klein wird wenn Sie das Ganze betrachten dann haben Sie hier eine Zuweisung da tun sie jeweils 2 n Zahlen a und b eine weitere Fälle Zahl zuweisen und nicht negativ reelle Zahl wenn das ganze können Sie sich dreidimensional vorstellen in dem sie das als indem sie diese A und B auf der XY Fläche abtragen und den Funktionswert rüber im Raum abtragen das heißt für jedes einzelne A und B bekommen sie einen .punkt dem Pollenarten A B und als z-Koordinate dieses des Quadrates Art ist es sogar drahtlos 1 bis 2 a -minus )klammer zu vertrat das Ganze beschreibt ihn dann eine Fläche im Raum und was wir suchen ist derjenige Punkt auf der Fläche wo die z-Koordinate am kleinsten ist ich habe Ihnen vielleicht hier mal nein
Perspektiv Lord mit in Statistikprogramm geblottet dabei ist die Fläche eben dann auf der Fläche haben sie nur einzelne Linien geplaudert und sich die vielleicht irgendwie so aus und dann sehen Sie dann gibt es da oben wo eine minimal stelle und ich suche ich also ich suche ich nicht denn die die mit der Marinade von dieser in den Wald der zunächst sogar A und B so dass die zugehörige Z minimales wenn Sie das alles können Sie jetzt konkret ausrechnen wie ins nächste Mal gleich allgemein machen wenn sie es konkret ausrechnen geben Sie als minimal Stelle gleich -minus 5 14. B gleich 3 14. raus die gesuchte gerade hier wird sogleich wieder zum 14. Mal 2 bis 3 14.
und die gesuchte gerade wurde dann so aussehen also hier können Sie es konkret berechnen wir werden jetzt fallen nächsten Mal und das meine letzte Folie für heute folgendes sehen sehen allgemein für
diese Gruppe die Minimierung Aufgabe auf die sogenannte Regressionsgerade und die kann ich speziell schreiben nämlich y ist ein kommerziellen Art achtmal X -minus x quer +plus Beziehung mehr also das ist die Steigerung der y achsen Abschnitt von der gerade ist y quer -minus A Dagmar Square die schreit die gerade in der Form also X für uns und wir sind unsere empirischen arithmetische Mittel der X Koordinaten beziehungsweise der und Kombinaten ich schreibt die gerade speziell in der Form damit und mit einem Schlag sieht wenn Sie in diese gerade die Xtra XP einsetzen ist der Nutzen der Apps sind wir das heißt die gerade geht durch den Punkt X quer zum Mehr und das einzige was den fehlt es noch was ist diese Steigung Art und für diese Steigungen ja x 14 versteht hier und für die Steigung Altach gibt es folgende Formel das ist Einbruch Zähler solche Männer den Männer kennen sich schon den Nenner ist die empirische Varianz von den X Kontendaten und Erzähler ist eine neue Art der Erzähler ist eines durch N -minus 1 mal zum I gleich 1 bis n Exiles X der weil nie wieder sind wir das Ganze wird als in so genannte empirische Kovarianz der zweidimensionalen Messreihe der x-ten Czerny bezeichnet ok das ganze da ich dann nächstes Meyer haben Sie noch Fragen so weit fragen um welche Art ja wenn nicht dann sehen wir uns am Freitag
Geschwindigkeit
Punkt
Balken
Stichprobe
Stichprobenumfang
Untergruppe
Histogramm
Balken
Histogramm
Flächeninhalt
Höhe
Rundung
Höhe
Flächeninhalt
Graphische Darstellung
Koordinaten
Stichprobe
Fläche
Arithmetisches Mittel
Histogramm
Histogramm
Kerndarstellung
Flächeninhalt
Dichte <Physik>
Flächeninhalt
Verallgemeinerung
Dichte <Physik>
Schätzfunktion
Verschlingung
Kerndarstellung
Graph
Dichte <Physik>
Extrempunkt
Schätzung
Dichteschätzung
Stichprobenumfang
Zahl
Dichte <Physik>
Schätzfunktion
Arithmetisches Mittel
Histogramm
Variable
Histogramm
Verschlingung
Statistische Maßzahl
Mittelungsverfahren
Zahlengerade
Streuungsmaß
Platte
Term
Zahl
Länge
Arithmetisches Mittel
Mittelungsverfahren
Addition
Messgröße
Parametersystem
Reelle Zahl
Lageparameter
Stichprobe
Reihe
Zahl
Arithmetisches Mittel
Stichprobe
Mittelungsverfahren
Mittelwert
Medianwert
Umfang
Variationskoeffizient
TVD-Verfahren
Faktorisierung
Punkt
Streuung
Maßstab
Gradient
Freiheitsgrad
Mittelungsverfahren
Index
Spannweite <Stochastik>
Quadrat
Standardabweichung
Inhalt <Mathematik>
Varianz
Umrechnung
Addition
Parametersystem
Quotient
Streuung
Varianz
Statistische Analyse
Inferenzstatistik
Zahl
Null
Spannweite <Stochastik>
Arithmetisches Mittel
Summe
Strecke
Ausreißer <Statistik>
Betrag <Mathematik>
Größenordnung
Standardabweichung
Variationskoeffizient
TVD-Verfahren
Messgröße
Länge
Punkt
Quantil
Rechteck
Maßstab
Kante
Linie
Statistische Maßzahl
Mittelungsverfahren
Standardabweichung
Graphische Darstellung
Stichprobe
Streuungsmaß
Streuung
Abbildung <Physik>
Heuristik
Medianwert
Strecke
Ausreißer <Statistik>
Variationskoeffizient
Ganze Zahl
Schwankung
Ecke
Standardabweichung
Zusammenhang <Mathematik>
Zusammenhang <Mathematik>
Mathematik
Quantil
Statistik
Supremum <Mathematik>
t-Test
Maximum
Kante
Medianwert
Umfang
Linie
Verzerrung
Normalverteilung
Verzerrung
Minimum
Höhe
Stichprobe
Einfach zusammenhängender Raum
Zusammenhang <Mathematik>
Zusammenhang <Mathematik>
Menge
Umfang
Lineare Regression
t-Test
Fünf
Umfang
Physikalische Theorie
Parametersystem
Lineare Regression
Wald <Graphentheorie>
Zusammenhang <Mathematik>
Punkt
Minimierung
Minimierung
Fläche
Diagramm
Zahl
Summe
Lösung <Mathematik>
Negative Zahl
Quadrat
Polynom
Betrag <Mathematik>
Vorzeichen <Mathematik>
Reelle Zahl
Lineare Regression
Anpassung <Mathematik>
Lineare Funktion
Gerade
Fläche
Arithmetisches Mittel
Kovarianzfunktion
Punkt
Minimierung
Kovarianzfunktion
Varianz
Koordinaten
Zahl

Metadaten

Formale Metadaten

Titel Statistische Maßzahl, Einführung in die Regressionsschätzung
Serientitel Einführung in die Stochastik
Autor Kohler, Michael
Lizenz CC-Namensnennung - keine kommerzielle Nutzung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen und nicht-kommerziellen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen und das Werk bzw. diesen Inhalt auch in veränderter Form nur unter den Bedingungen dieser Lizenz weitergeben.
DOI 10.5446/34024
Herausgeber Technische Universität Darmstadt
Erscheinungsjahr 2011
Sprache Deutsch

Inhaltliche Metadaten

Fachgebiet Mathematik

Ähnliche Filme

Loading...