Bestand wählen
Merken

Histogramme, Dichteschätzung

Zitierlink des Filmsegments
Embed Code

Automatisierte Medienanalyse

Beta
Erkannte Entitäten
Sprachtranskript
genannt erinnern an der TU Darmstadt in also
gut sich noch mal recht herzlich zur heutigen Vorlesung ich sage mal wieder Wiederholung vom letzten Mal an bei der Studie wird eine sogenannte Studiengruppe mit einer so genannten Kontrollgruppe verglichen im Rahmen von kontrollierten Studien hat Einfluss auf die Versuchsobjekte genommen während diese bei Beobachtungsstudie nur beobachtet werden nur mit Hilfe von prospektiv kontrollierten Studie mit Randomisierungen kann auf kausale Zusammenhänge geschlossen werden n bei allen anderen Studien kann das Ergebnis durch sogenannte kontrollierende Faktoren verfälscht werden die gleichzeitig Einfluss haben auf die Einteilung der Versuchsobjekte in Studien Kontrollgruppe und auf das beobachtete Resultat Übersicht über die verschiedenen Arten hab ich ihn
auch mal hintendran gehängt um festzustellen um was es sich für eine Studie handelt fragen sich als 1. ob im Rahmen der Studie Einfluss auf die Versuchsobjekte genommen wird falls nein es ist eine Beobachtungsstudie was ja fragen Sie weiter würde Studiengruppe mit Daten aus der Vergangenheit verglichen was ja haben sie eine retrospektiv kontrollierte Studien weiß nein schauen sich an ob die Einteilung Studien Kontrollgruppe zufälliger folgt weiß ja es ist eine prospektiv kontrollierte Studie mit Randomisierung weiß nein eine prospektiv kontrollierte Studie oder eine Mission ok so weit zur Wiederholung vom letzten Mal und dann ,komma zur eigentlichen 9
Vorlesungen ich war heute mal mit dem Thema
Umfragen gegeben ist dabei eine Menge von Objekten die sogenannte Grundgesamtheit mit gewissen Eigenschaften und das Ziel ist man möchte feststellen wie viele Objekte der Grundgesamtheit eine gewisse Eigenschaft haben am Beispiel von Wahlumfragen beispiele wäre sogenannte Sonntagsfrage wie viele der Wahlberechtigten in der BRD würden für die einzelnen Parteien stimmen wenn nächsten Sonntag Bundestagswahl wäre ich habe ihn mal Ergebnisse von
Wahlumfragen vor der letzten Bundestagswahl am 27. 9. 2009 mitgebracht das in Wahlumfragen von 5 verschiedenen Umfrageinstituten und
zusammen mit dem amtlichen Endergebnis jeweils angegeben der Tag an dem die Umfrage veröffentlicht wurde ok also nochmal die Frage wenn sie diese Umfrageergebnisse vergleichen auch das amtliche Endergebnis sich dazu angucken verdienen ohne dass auf oder erkennen Sie daran und etwas viel aber das ist die Stelle wurde diese Vorschläge aus dem Publikum kommen könnten um die Sache so wie so ein bisschen voranzubringen 7 der Schallplatte Sinne altmodisch Schallplatte Henke also wenn sei nichts machen Ernst bleibt über sein also Vorschläge sehen Sie und was bitte die Zahlen scheinen ganz gut zusammen eine mögliche Antwort stimmen alle überein das amtliche Endergebnis der SPD ist nicht der durch den von dem anderen also von der SPD ja von der CDU auch nicht mehr von der SPD ich meine gutes müsse sich unbedingt der Durchschnitt sein aber zumindest das ist irgendwie deutlich darunter auf aber da können Sie nicht unbedingt auf einen Fehler bei den Umfragen schließen weil sie müssen ja bedenken dass sind ja noch gewisse Zeiten dazwischen also die Umfrage war noch vor der Wahl könnte seine letzten Tagen hat sich das Wahlverhalten noch verändert für den sonst muss auf den 2. verloren 2 Umfragen vom selben Tag haben verschiedene Ergebnisse sie haben 17. 9. und den 17. 9. das heißt wenn Sie Umfragen untereinander vergleichen dann sehen Sie dass die Umfragen untereinander variieren und damit erkennt man dass das Problem irgendwie nicht so ganz einfach sein kann man kann jetzt nicht sagen welche Umfrage jetzt viel besser war als die andere aber was ich eben wie gesagt dass das Wahlverhalten noch geändert haben könnte zwischen Umfrage und Wahl aber ganz es zumindest sagen es sind ist da wahrscheinlich nicht ganz einfach zu sein wenn sie speziell sich vorsahen angucken das war die letzte Umfrage vor der Wahl für öffentlich wurde dann war es eben da so das Schwarzgeld 47 Prozent der Stimmen hatte in der Umfrage und rot-grünen rot-rot-grün hatte auch 47 Prozent der Stimmen das heißt es danach im klassischen hat aus was nach der sehr knappen Wahl aber beim amtlichen Endergebnis nicht mehr also da war anders war vorher schon noch anders aus und auch bei diesen einzeln und unseren Umfragen untereinander war das noch sehr verschiedener sich über alles was traditionell der CDU Na steht bei uns auch Schwarz-Gelb 48 , 5 Prozent zum Fest 46 , 5 Prozent also deutlich mehr eigentlich aber sie sehen es gibt deutliche Variationen zwischen den Umfrageergebnissen also ganz einfach scheint die Sache nicht zu sein
das prinzipielle Problem bei Wahlumfragen oder eigentlich bei jeder Umfrage der größeren der Grundgesamtheit ist dass die Befragung aller Wahlberechtigten zu aufwendig ist also wenn Sie wirklich alle Wahlberechtigen fragen wollten vor der Bundestagswahl ja das ist das wäre sogar auf weniger als die oder sie müssen halt die Wahlen noch vor durchführen was eben und wie nicht möglich ist der Ausweg ist man befragt nur eine kleine Teilmenge das ist lieber spricht er von einer sogenannten Stichproben der Grundgesamtheit und versucht dann ausgehend von dem Ergebnis dieser kleinen Teilmenge auf das Ergebnis der Grundgesamtheit zurückzuschließen der Chefstatistiker spricht ja davon man schätzt das wäre und mit Hilfe dieses Resultats die gesuchte Größe stellen sich dann 2 Fragen 1. wie will man die Stichprobe also die werden Sie diese kleine Teilmenge und zweitens wie schätzt man ausgehend von der Stichprobe die gesuchte Größe
mögliche Antworten im Beispiel oben sind zweierlei 1. sie können die eine Möglichkeit ist die Stichprobe durch eine rein zufällige Auswahl von allen Personen aus der Menge der Wahlberechtigten zu wählen und die für dieses N also diesen Umfang der Stichprobe würden Sie sowas Größenordnung 2000 1000 denn üblicherweise also ein bis 2 Tausend der 4 mal 2 tausende schrieben anschließend können Sie dann die prozentualen Anteil der Stimmen für die einzelnen Parteien in der Menge aller Wahlberechtigten durch die entsprechenden prozentualen Anteil in der Stichprobe schätzen das heißt die gucken sich einfach an die hätte meine Stichprobe abgestimmt wie viel Prozent bekommen da die einzelnen Parteien und behaupten einfach in der Grundgesamtheit der das genauso wir werden später sehen das sofern sie erst wenn es wirklich durchführen können das 2. eigentlich eine gute Idee ist weil das 2. 1 eine sinnvolle Art ist diese Schätzung durch 10 Wort durchzuführen aber die große Frage die sich stellt ist wie machen Sie das 1. wie wären sie wirklich rein zufällig n also hier 2000 der Sohn aus der Menge der Wahlberechtigten an aus ich habe mir mal beide Reihe
von Vorschlägen aufgelistet genau 5 1. Vorgehen wäre aber fragt einfach die Studenten seine Statistik Vorlesungen oder von Mehr Unstatistik Vorlesungen und rechnet aussehen das Wahlergebnis suchen 2. vorgehen man stellt sich montags morgens um 10 Uhr in einen festen Punkt der Fußgängerzone in Darmstadt und befragt einfach die 1. Person die vorbeilaufen 3 nach 3. vorgehen meine stellt sich eine Liste aller Wahlberechtigten mit Adresse hat dann einen Zufalls Mechanismus zur Verfügung das geht relativ einfach um aus dieser Bestenliste Endversion auszuwählen und dann sukzessive diese Personen vor das Vorgehen man nimmt sich ein Telefonbuch für ganz Deutschland wer darin zufällig Nummern aus auch das geht jeder einfach und befragt dann die 1. n Person die man erreicht also Telefonumfrage und 5. die Telefonumfrage nochmal modifiziert man verzichtet auf das Telefonbuch man ich jetzt einfach zu verlegen und am Telefon ungefragt die 1. Ernte Privatpersonen die sich melden ich gesehen haben so 5 Minuten vielleicht Zeit sie können mit ihrem Nachbarn oder ihrer Nachbarin einfach mal diskutieren was sind die Vor-und Nachteile der einzelnen vorgehen und anschließend sammelte die Ergebnisse ok dann würde es ganz gerne mal Anfang des Resultate zu sammeln hat jemand oder hat und Ihre Kommentare bitte kann also sind alle nicht gut aussieht 3 ist aufwendig als wird hier schon mal ein nach 3 genannt das ist zu aufwendig und das ist zu aufwendig ja es zu teuer einfach deswegen weil diese Wahlberechtigen sind ja in ganz Deutschland verteilt wenn sie teils zufällig welche aus man dann werden natürlich die Adresse noch in ganz Deutschland verteilt sein dann müssen sie durch ganz Deutschland sukzessive reisen um die Leute zu befragen was sehr aufwendig ist ok stellen ok 3 hatten einen weiteren Nachteil nämlich den sogenannten Datenschutz will die Frage woher bekomme die Daten der insbesondere es gibt auch eine Reihe von Ländern zum Beispiel die USA da hat man so eine Liste aller Wahlberechtigten überhaupt nichts ok weitere Kommentare leicht ganz ich der ok also ich ich fasse mal kurz zusammen bei vielleicht an der Stelle schon aber geht also hier wurde ein weiterer sehr guter Punkt angesprochen nämlich anhand des 2. vorgehen wenn man da morgens um 10 Uhr in der Fußgängerzone guckt man sich vielleicht vor allem auch Leute die nicht berufstätig sind also nur Befragte allen eine Untergruppe der Bevölkerung und das könnte auch bei den ganzen anderen Vorgehen sein zum Beispiel beim 1. gerne sehen weil die Studenten ein vor Leute die im Telefonbuch stehen was oder die sich ins Telefonbuch am eintragen lassen was die Leute auch vom Rest unterscheidet und man bekommt dann vielleicht eine Aussage über das Wahlverhalten dieser Leute aber vielleicht nicht über den Rest ok andere Aspekte noch mit dem in ok nochmal ein Mann bei Vorgehen Zweige in die gleiche Richtung L geht man befragte Leute aus Darmstadt und diesen gar nicht für die Bundestagswahl repräsentativ beziehungsweise die Bundestagswahl wird also es kann sein dass die Leute außerhalb von Darmstadt eben anders ab abstimmen was Leute in Darmstadt ok noch und Kommentaren weil
so ok war vor dem 5 wird angemerkt hat 2 Nachteile beschließen alle Obdachlosen aus ne das ist weil die kein Telefon haben vermutlich das und den richtig aber ich weiß nicht wie viele Obdachlose zur Bundestagswahl gehen also und 2 ist essen weil ich wäre Verschwendung wann oder zu Mehrkosten wo Sachen bei oder Nummern anruft und die dies gar nicht existieren vorbei dann macht auch nicht unbedingt kosten aber es durchaus Band aber es mir könnte um die Maschine machen lassen alles kann sich vorstellen dass kriegt man vielleicht noch einigermaßen hin ok ja und damit an ich und was weiß ich ok sie haben ganzen Alternativvorschlag sie würde das alles nicht machen Sie machen Vorgehen 6. Sie gucken sich einfach Ehre also im Prinzip die Vorstellung dahin gehend wenn Sie wenn Sie kleine Gruppe von Personen haben von der sie wissen sie stimmt genau so ab wie hier also im Durchschnitt stimmt sie genauso ab wie der Rest daneben gibt es natürlich vollständig die zu befragen also stellen sich vor Sie hätten ein kleines Dorf und dieses kleine Dorf stimmt über genauso ab in prozentual die die Bundestagswahl ausfällt dann reicht natürlich dieses kleine Dorf zu befragen nur 7 Wochen in dieses kleine Dorf und das Problem ist dieses kleine Dorf muss jedes jedes bei jeder Bundestagswahl das so machen und das ist natürlich die Schwierigkeit dran ok vielleicht noch 2 Kommentare noch in der sie hatten zur ziehen also hier kommt ein neuer Aspekt angesprochen auf Vorgehensweise trifft aber eigentlich alle Vorgehen unter Umständen antworten ihn nicht alle Leute es gibt eine sogenannte Verzerrungen bei den Umfragen weil ein Teil der Leute einfach ein Umfrage nicht teilnehmen wird also wenn Sie sich morgens in die Fußgängerzone in Darmstadt stellen die Leute fragen können Sie mir kurz ne sagen was sie bei der nächsten Bundestagswahl man dann werden sie in sich einige sagen nein kann ich nicht und es ist keine Zahlen deren Wahlverhalten unterscheidet sich vom Rest kann zum Beispiel sein weil gerade Leute die extremistische Parteien man sowas nicht zugeben wollen aber das trifft nicht nur Vorgehen 2 das trifft im Prinzip alle Vorgehen also bei jeder Umfrage haben Sie ein ganz massives Problem dadurch dass ein Teil der Leute Ihnen die Antwort verweigern wird und dieser Teil der Leute essen anders sein wird als der Rest allein schon ist deswegen anders weil er die Umfrage verweigert es gibt eine Umfrage über dieses Problem mich hat am See des in in ok also bei der ersten könnte meine Zettel sehen und der Vorschlag nein ich meine es gibt eine Art von Umfrage in Deutschland wo sie dieses Problem das verweigern wird von nicht Bord nicht haben ob sie dann in werden je besser es ist Bundesamt macht den sogenannten Mikrozensus und da gibts ne Auskunftspflicht also da sind sie verpflichtet zu antworten bei Musikern sie können immer noch falsch antworten oder sie können aus Prinzip weiter nicht antworten wäre das alles war also auch ein Problem warum sie sowas in der Volkszählung vielleicht machen immer wieder machen sie auch dieses Jahr wieder weil sie einfach also mit Umfragen allein schaffen sie es unter Umständen nicht rein weil ihn die Leute helfen mir die Antworten verweigern ok vielleicht noch ein letzter Kommentar zu diesem 5. vor den ok also 2 Einwände zuvor den 4 und 5 zum Telefon Fragen 1. die rufen an und fragen dann vielleicht jemand der gar nicht wahlberechtigt ist dass wir natürlich blöd aber das können sie und wie versuchen rauszubekommen wenn Sie Leute fragen sind sie war berechtigt sie geht natürlich davon aus dass ja ich meinen sie gehen sowieso davon aus dass ihn jemand was ehrliche sagte also wenn Sie die Leute alle bei der Umfrage ein Leben dann haben sie sowieso keine Chance das ist eine und das 2. wurde angemerkt bei 5. keiner seiner wir zweimal die gleiche Nummer ja das müssen Sie im Prinzip ausschließen aber wenn Sie die Nummern hinreichend viele Ziffern haben wir das eigentlich nicht vorkommen wenn sie 2000 Nummern auswählen aber das kann man relativ einfach am Rechner austesten ok schauen wir mal was ich alles aufgeschrieben haben Probleme aber schon gesehen
vor den 3 ist zu aufwendig bei allen anderen Vorgehen gibt es eine sogenannte Verzerrung durch Auswahl Fachbegriff ist sehr beides die Stichprobe ist nicht repräsentativ bestimmte Gruppen der Wahlberechtigten deren Wahlverhalten vom Durchschnitt abweicht sind überrepräsentiert zum Beispiel beim Vorgehen 1 die Studenten beim Vorgehensweise das war dieser Feste .punkt in der Fußgängerzone die Einwohner von Darmstadt oder auch die Person die den Interviewer sympathisch sind also und sich überlegen sich sie stellen sich selber die Fußgeher Sohn oder schicken jemand hin und sagen Sie wir fragen Sie mal da wären so und so viel Leute vorbeilaufen die würden Sie mich fragen oder doch der nicht fragen die dann so aussehen dass die für dich fragen bei den Umfrage mit dem Telefonbuch was die Person mit Eintrag im Telefonbuch bei Umfragen im Telefon generell müssen sie aufpassen dass sie nicht nur Personen bekommen die telefonisch leicht erreichbar sind das können Sie ausgleichen indem sie wenn sie einmal angerufen haben und niemand erreicht haben sich die Nummer Märkten unter immer wieder anrufen und bei Telefonumfragen haben sie auch das Problem die Telefone hängen meistens am Haushalt also meistens hat jeder Haushalt einen Telefon geformt und damit 10 Personen die in einem kleinen Haushalt leben haben eine größere Chance befragt zu werden dass Personen die einen großen Haushalt leben auch da müssen Sie das machen 2. Problem was sie auch angesprochen
haben ist das verzerren durch nicht antworten sogenannte Nonresponse es ein Teil der Befragten war die Antwort verweigern und deren Wahlverhalten kann vom Rest abweichen und das ruiniert in so ziemlich die Umfrage alles ist irgendwie doof ok zum Abschluss zum Umfragen möchte ich noch was erzählen wie sie heutzutage reale Umfragen durchführen das eine wöchentliche Umfrage von TNS Emnid im Auftrag von N TV da werden telefonisch pro Woche circa 1000 Wahlberechtigte befragt die ob gewählten Telefonnummern werden dabei zufällig aus Telefonbüchern und CD-ROMs ausgewählt das heißt das TNS-Emnid hat eine Menge von ich glaub circa 100 Tausend nicht auf 10 Tausend Telefonnummern die sie erst mal zusammengestellt hab aus Telefonbüchern und CD-ROMs und da schon einigermaßen zufällig ausgewählt hat und aus dem Sport an war anschließend noch die letzte Ziffer modifiziert also die letzte Ziffer wodurch eine Zufallszahl ersetzt die Vorstellung dahinter ist man möchte auch Leute bekommen die keinen Eintrag im Telefonbuch haben und hoffentlich ist es so dass sich diese Nummern von den Leuten die kein Eintrag haben nicht systematischen bescheiden vom Rest dann vielleicht nur also ansonsten genauso den und liegen wieder wenn ich nur die restlichen die letzte Ziffer modifiziere dann erwisch ich diese Nummer mit Worten mir sind Reisen und anders verhindert dann das rein zufällig wählt das und vielleicht am laufenden Band erzeugt die dieser ich gar nicht gibt innerhalb des so ausgewählten Haushalts wird dann nicht der 1. fragt der sich meldet sondern die Zielperson nur durch einen Zufall Schlüssel ermittelt eine ganz einfache Sache wäre zum Beispiel man fragt wer hat denn den Haushalt als letztes Geburtstag und es berechtigt und befragt denn dann also nicht nur die Leute zu bekommen die immer ans Telefon gehen und anschließend nur die Schätzung jetzt nicht so naiv gemacht die das wollen betrachtet haben weil die die ausgewählten Person eben doch nicht rein zufällig aus der Menge aller Wahlberechtigten sind so so eine Schätzung gebildet durch Gerichte der Mittelung der Angaben der Personen der Stichprobe das heißt Personen der in der Stichprobe manche Personen werden mehrfach gezählt man sie vielleicht nur Einheit und das vor durch Gerichte bestimmt und diese Bild gerichtet und sich in 1. das ist relativ einfach die Haushaltsgröße das heißt damit verhindern Sie dass Leute die in kleinen Haushalt neben ein zu großes Gewicht bekommen 2. die demografische Zusammensetzung der Menge aller Wahlberechtigten dies aus dem Mikrozensus der er das Statistische Bundesamt bekannt also da gucken sich dann solche Sachen an wie stimmt der Anteil der Männer und Frauen in ihrer Stichprobe und stimmt die Altersstruktur ausspricht wurde und wenn nicht dann gehen sie vielleicht eher wenn sie zu viele Männer drin haben oder zu viele Frauen haben gehen sie vielleicht den Frauen ein kleineres Gewicht als den und das auszugleichen und dann gibt es noch eine Sache mit der wir versuchen können er auszugleichen dass manche Leute vielleicht nicht zugeben was sie beim letzten Mal oder was sie denn wollen weil sie irgendwie peinlich ist weißen extremistische Partei ist wenn Sie Fragen darüber hinaus auch noch nach dem Abstimmungsverhalten bei der Bundestagswahl davor und dann passen sie die Gewichte so an dass bei der Bundestagswahl davor mit den angepassten Gedichten das richtige rauskommt und damit haben Sie dann hoffentlich den einzelnen oder ausgeglichen das eben manche oder von 19 Parteien nur weniger zugeben dass sie die Mehr problematisch an dem letzten Punkt ist dass die Leute sich zum Teil gar nicht mehr daran erinnern was Sie eine Bundestagswahl davor gewählt haben und das wieder letzten Landtags und Europawahlen verwechseln ok haben Sie Fragen so weit in den Umfragen was ist denn hier bei mir denn der Sohn dieser schwer erreichbar sind ja dann müssen sie mehrfach anrufen das ist klar das wird das Wort gemacht die Zielperson durch zu verschlüsseln oder müssen sie anschließend natürlich versuchen diese tiefer Person zu bekommen natürlich was eine gewisse Grenze geben also sie dem was 2 dreimal versuchen und den sie aufgeben und er also konkret werden sind ganz wenn sie es nicht schaffen das 2. mit deren Hilfe eine ausgleichen können ist diese ganzen Verzerrungen können Sie helfen wir mit diesen angegebenen Abstimmungsverhalten bei der letzten Bundestagswahl ausgleichen ok weitere Fragen inwiefern ist in abhängig von der Gesamtmenge der Wahlberechtigten das heißt sehr gute Frage wenn Sie eine sehr große Bevölkerung haben brauchen Sie dann eine größere Stichprobe als wenn sie eine sehr kleine Gruppe haben die Antwort ist eigentlich gar nicht also normalerweise würden Sie dieses N überhaupt nicht abhängig machen also sie würden sie werden genauso wie die genau der gleichen Zahl Sample sofern es eine gewisse Mindestgröße hat wenn es sehr klein ist ist klar wenn sie nur 100 Leute haben können Sie keine tausende Fragen wer beziehungsweise wenn sie eben nur 2 Tausend Leute haben und sie auch nicht unbedingt aufpassen sie tausende fragen müssen was es mehr den gleichen mehrfach erreichen aber wenn der wenn es schon hinreichend groß ist im Vergleich zu nennen dann Spiele sein ich gar keine Rolle mehr noch ne Frage gut dann dadurch
würden Kapitel Erhebungen von Daten und kommen zum Kapitel 3 deskriptive und explorative Statistiken gegeben ist eine Messreihe auch Stichprobe oder Datensatz genannt kleine x 1 =ist gleich x n n ist der Stichprobenumfang die Aufgabe der deskriptiven oder beschreibenden Statistik ist Eigenschaften von dieser Messreihe übersichtlich darzustellen die Aufgabe der explorativen oder erforschen Unstatistik ist innerhalb dieser Messreihe neue unbekannte bisher unbekannte Strukturen zu finden beides lässt sich nicht so ganz klar trennen weil immer wenn sie das übersichtlich dargestellt haben können Sie natürlich unter Umständen auch ganz schnell neue Strukturen erkennen ich mach 2 Beispiele
1. Beispiel mit dem beschäftigen wir uns dann nächste Woche fallen das sind die monatlichen Nettoeinkommen von Alleinstehenden in Deutschland im Jahr 2002 Angaben stammen aus dem Mikrozensus des Statistischen Bundesamtes da wird ne Tabelle veröffentlicht das Ganze ist ein bisschen und doch ein bisschen analysiert das heißt er die Angaben sind nicht genau auf also keine Stichprobe oder keine Daten gegeben auf den Euro genau so nur in gewissen Bereichen damit sie nicht auf die Einzelperson zurückschließen kann man da sicher gerundet und 2. Punkt ist es wird irgendwo oben abgeschnitten also es soll eben nicht möglich sein auf Grund das Gehalt zum Beispiel festzustellen diese Angaben hat der allgemein gemacht weil das Gehalt war so hoch es gibt nur ein oder so also dauert ein bisschen angefasst und aus diesen Angaben hab ich dann die folgenden 100 Zahlen zusammengestellt das 2. was ich betrachte ist der deutlich größere Stichproben nämlich das Alter der circa 32 Millionen männlichen Einwohner unter 95 Jahren im früheren Bundesgebiet der BRD im Jahr 2000 1 wieder basierend auf Angaben vom Statistischen Bundesamt und da kann man im Prinzip sogar eine alles ist nicht wert dass wir einst mit Vollerhebung immer hier sogar hat ich hab ihn dabei nur 3 angegeben aber das klar sind eigentlich jede Menge Zahlen bevor wir uns überlegen wie wir da jetzt übersichtlich Eigenschaften darstellen können und unbekannte Struktur finden wollen möchten
kurz was sagen über mögliche Typen von Messgrößen oder Merkmale oder Variablen die auftauchen können das ist insofern wichtig weil die meisten statistischen Verfahren zumindest implizit Annahmen über den Typ bis er mehrmals oder variabel der Messgröße die sie betrachten machen das heißt wenn Sie das anwenden müssen gewisse Operation zulässig sein und wenn sie es einfach anwenden ohne dass diese Operation zulässig sind kommen essende unsinnige Resultate aus 1. wirklich Unterteilungen mehr Sie gucken sich an wie viel Ausprägungen gibt es man das Ganze dient das Gerät wenn endlich oder abzählbar unendlich viele verschiedene Ausprägungen möglich sind wenn das ganze Ding wenn alle Werte eines Inter weiß aus als Ausprägung möglich sind wenn sich mal vorstellen können Sie mir und ein Beispiel aus der Praxis den von einer diskreten Größe also können Sie online diskrete Messgröße ein Teil der Kinder zum Beispiel ganz klar im Prinzip absehbar es viele Ausprägungen aber anders als er endlich der Faktum alternativ können Sie und eine stetige Messgröße in Wiener Praxis bei der Nadel Produktion zum Beispiel bei einer Produktion die Abweichung von der Norm Länge er die kann im Prinzip alle Werte eines in damals an wen aber wenn sich anders als überlegen wenn Sie das real messen dann werden sie das nie belegen aber es können das heißt alle Daten die sie eilig in der Praxis haben werden einig zwangsläufig immer diskret sein also ein schon weil sich das irgendwie er 15 ist allein schon die abspeichern da werden sie es mit nur endlich vielen Ziffern abspeichern sie keine Chance das heißt es gibt eigentlich keine bestätigten Messgrößen es trotzdem extrem nützlich er eine Theorie zu machen mit stetigen Messgrößen weil er mit Hilfe von diesen stetigen Messgrößen kann man sehr gut während sie dann im Lauf der weiteren vorlesen sehen diese diskreten Messgrößen approximieren deswegen machen aber das Leben eine wir Mathe mittig vor allem stetige Messgrößen und die werden auch bei gewissen Krenz-Prozess die wir durchführen also wenn der Ergebnisse auf Aldi und zum Beispiel werden die sich zwangsläufig er oder werden sie sich als Grenzwert ergeben also was kommt raus und dient als gute Approximation aber der Faktor für die Praxis könnten sich auf diskrete Ausprägung zurückziehen aber es wäre belaufen auf Aufbau einer Theorie nicht sinnvoll wenn
2. mögliche Unterteilung geht dahin gehend sie gucken sich die Struktur des Wertebereichs an und überlegen ist ein Abstand Begriff vorhanden das heißt kann ich bei 2 werden sagen wie weit diese entfernt sind oder ist eine Ordnungsrelation vorhanden das heißt kann ich wenn ich 2 Werte ausnehmen Sagen der Eigenwert kommt vor dem anderen die eigene wertesten irgendeinen Sinn viel kleiner als der andere wehrt ja oder nein wenn ich beides kann ich spreche ich von der allen Messgrößen wenig nun Ordnungsrelation habe aber keine Abstands Begriff spreche von ordinalen Messgrößen hab ich nur ein Abstand Begriff aber keine Ordnungsrelation hab ich Zirkulare zirkuläre Messgrößen hab ich beides nicht sprechen von nominal Messgrößen können Sie mir ein Beispiel nehmen von Messgrößen denn in irgendein diese Bereiche fallen also 4 verschiedene Beispiele die oder beziehungsweise so sieht erst mal 1 der das Nein der Bereiche fällt und dann der nächste in ein Beispiel was wir bisher noch nicht hatten nominal das Geschlecht weibliche lebendig werden bei Prinzip sie können Abstand noch definieren wenn sie nur 2 haben aber einfach 1 und 0 beim gleichen aber im Prinzip haben Sie Recht und Ordnungsrelation kann schlecht sagen er kommt vor dem andern ok weitere Beispiele was der über das Alter von Personen mal von der Sohn können Sie ganz klar sagen Sie können abstimmen lassen Alter in Jahren vielleicht einfach die Differenz bezahlen und Sie können sagen will wer ist der Komfort dem andern der Jurist Original wäre wenn sie eine Abschätzung geben die gut etwas ist also zum Beispiel etwas benotet also zum Beispiel Schulnoten ja ganz klar da haben eine Ordnungsrelation sehr gut kommt vor gut gut Komfort befriedigen und so weiter aber sie kam Einigkeit Abstand betrifft sie können natürlich sagen Abstand von sehr gut so gut es 1 aber dann der Abstand von ausreichend zu ungenügend auch 1 und das ist nicht unbedingt das Gleiche ok dann gibt es noch ein ganz komischen fallen nicht zirkulär für den und was zirkuläre sein was wie weit sie von einem gewissen Ort weg wohnen wenn es auf der Kugeln betrachten wir Sonne wir ja alle abstellen auf der Kugel könnte man sagen ich hätte sonst was gesagt die Uhrzeit Uhrzeit verglast ist zirkulär sie haben 1 Abstands Begriff zwischen der Uhrzeit aber eben könne nicht sagen ob jetzt 10 Uhr vor 12 Uhr kommt oder 12 Uhr 14 Uhr je nachdem wie wir uns das betrachten will die um sie auf diesen Greis gehen ok das nächste was den einführen möchte sind Histogramm ich vorschlagen wir machen vor 5 Minuten Pause jetzige mal durchschnaufen und dann kommen die Histogramme ok ich war dann ganz gerne so weit weitermachen kann gut aber zum Abschnitt 3 1 Histogramme Ausgangspunkt bei die Erstellung eines sogenannten ist ganz ist eine Häuslichkeit Tabelle via teile als 1. die Daten in lassen ein für die Anzahl der Klassen gibt Faustregeln zum Beispiel K ungefähr gleich wird's laut NRK ungefähr 10 mal 10 log vom Stichprobenumfang aber es gibt eigentlich keinen keine wirkliche gültige Regel ja häufig Cindy Klassen bereits von der Anwendung der vorgegeben sie ermitteln dann wir jede einzelne dieser Klassen die sogenannten Klasse Neuigkeiten das heißt wie viele der Datenpunkte liegen in der Edelklasse das gibt ihnen der ne und sie stellen das Resultat dann in einer Tabelle dar das heißt die haben die Klasse 1 die Häufigkeit ist in 1 Klasse 2 Häufigkeit ist in 2 und so weiter bis Klasse K Häufigkeit ist K im
Beispiel 2 oben also der circa 32 Millionen männlichen Einwohner unter 95 Jahren früheren Bundesgebiet der BRD das heißt er aus Deutschland war damals noch nicht dabei wenn Sie in 19 gleich große Klassen unterteilen also von 0 bis 5 von 5 bis 10 von 10 bis 15 und so weiter bis 90 bis 95 ich schreib hier 0 bis 5 für das Intervall aller Zahlen von 0 bis 5 die eckige Klammer ist bei der 0 deswegen könnten nur noch dazu die offene klar es war der 5. wenn wir die 5 nicht mehr zu alles vermeiden tionieren dann bekommen Sie die folgende Tabelle also 0 bis 5 wären er 1096 sich ,komma 3 der der Anzahl in tausenden also 1 Komma 6 7 9 3 Millionen das Ganze ist ein bisschen unübersichtlich die können das sehr schön in einem sogenannten
Säulendiagramm TWh auftragen da tragen Sie einfach über der Klasse also Klasse von 0 bis 5 einen beiden mit Höhe die Gnade der Klassen Häufigkeiten spricht auf und dann bekommen Sie hier sollen wirklich sehr Vorstellung von der Altersstruktur im Jahr Zweitausendeins bei den Männern also sehr gesehen gerade Blick was sie vor bei den vielen zahle ich kaum gesehen haben noch können sie jetzt hier die Klassen auch anders sehen wenn Sie zum Beispiel speziell interessieren würde die für Kleinkinder gab's 0 bis 6 dann vielleicht so was wie Schüler von 6 bis 15 Berufstätige von 15 bis 65 und Rentner von 65 bis 95 würden Sie Folgen des Säulendiagramm bekommen also sie hätten nur noch diese 1 2 3 4 Balken hier und wenn Sie das genau angucken dann behaupte ich das ist grafisch irreführend also diese Darstellung bekommen grafisch einen falschen Eindruck haben Sie 1 Idee warum ok man geht davon aus dass die Fläche die Informationen hält aber eigentlich ist die Höhle und der das ist irreführend also das Augen primär die Flächeninhalte war wenn sie mal vergleichen die Klasse von 6 bis 15 Jahre und von 65 bis 95 hier von den Höhen der diesen ungefähr gleich großes heißt er ist kein großer Unterschied aber wenn sie den optischen Eindruck vergleichen dann wirkt das so als ob diese 2. Klasse ja von Rentnern viel viel mehr enthält also mindestens 4 Mal so viel B diese Klasse von den Schülern 6 bis 15 Jahren weil eben der Flächeninhalt viel größer ist das gleichen sie
aus beim sogenannten Histogramm im Gegensatz zum sollen der Gramm wird dabei auch die Breite der Klassen mit berücksichtigt dass Vorgehen ist dabei das folgende des unterteilen den Wertebereich der reell Messgröße wieder in K in der wie einst die sie K also die Klassen ist also ich gehe davon aus dass eine reelle Messgröße weglassen werden unterteilt der Wertebereich unterteilt in in der Wale ich möchte mir anschließend für jedes der in der Wale J die Anzahl ändert der Datenpunkte in diesem Intervall und tragen über ihr Urteil nicht ändert auf 12 Tage über ihrer stattdessen NJ geteilt durch n Malern davon wie alt wobei Lander von ihr hat die Länge von Irak ist auf wenn Sie das so machen dann sehen Sie sie haben über Ihr einen weiten Weg und Seite hat ist da die länge Lander davon erst die Höhe ist das hier dann sehen Sie der Flächeninhalt von den beiden ist Grundseite mal Höhe wenn sie das ausreichendes Lander verliert kürzlich aus bleibt NJ durch n ja das heißt der Flächeninhalt des Schweigens ist gerade die relative Anzahl der Datenpunkte in diesem Intervall also
Bemerkungen der Flächeninhalt eines Rechtecks ist gleich dem prozentualen Anteil der Datenpunkte im zugrundeliegenden Intervall wenn Sie das für das obige Beispiel machen bekommen sie die folgende Darstellung und wenn sie damals noch war die Klassen vergleichen von 6 bis 15 bis um 65 bis 95 dann ist zwar die 1 einen deutlich breiter aber dafür eben niedriger und wenn sie also mit dem Auge betrachten dann können sie nicht mehr so recht sagen welche enthält einig nicht mehr und die waren auch ungefähr oder annähernd gleich groß also ich genau aber zumindest ich würde sagen ich gekommen war Augen besseren Eindruck ok haben Sie Fragen so weit ok es kommt der folgende Einwand ist ja kein jetzt nicht mehr mit einem Blick ob in der einen Gruppe mehr drin ist das man nur nicht welche Nummer zurück bittere wenn ich hier genau hingeguckt
hat an sich natürlich sofort mit einem Blick hier sind eigentlich mehr drin als ihr wenn ich das jetzt also bei den sollen Diagramm mache wenn ich dass der Schmerz
beim Histogramm angucke ist vollständig recht richtig ich kann es nicht mehr richtig sagen ob es eigentlich hier mehr drin sind oder hier mehr drin sind der kann das nicht mehr richtig ja aber dafür muss sich eben nicht so arg aufpassen bei dem andern müssen Sie wirklich grafisch aufpassen dass es wirklich wahrnehmen also müsste sich das Ganze bewusstmachen hier können sie auch nur so im Vorbeigehen angucken und bekommen trotzdem gewissen Eindruck es eher für Zeitschriften galten als für Mathematiker meint sie weiß ich nicht also ja sie werden gleich noch sehen auf hinausläuft aber wir glaub ich vielleicht ein bisschen besser sehen um was es geht ok noch ne Frage wenn ich da jetzt integriere oder den Flächeninhalt eines Rechtecke rausrechnet dann kommt genau diese prozentualen Anteil aus das heißt die Gesamtfläche unter dem Ding muss gleich ein Fehler zum Beispiel eine der Eigenschaften ok statt warum machen wir das eigentlich nicht für was sondern wir machen das um es müssen zu verallgemeinern und es kommt im nächsten
Abschnitt über Schätzung nach das ist Histogramm ist die Unstetigkeit die hier in also wenn das als Funktion betrachten einfach Funktionsgraphen ist diese obere Kante der Rechtecke bekommen Sie eine unstetige Funktion und diese Unstetigkeit erschwert Interpretation der zugrundeliegenden Struktur ich habe hier noch mal die Altersstruktur der Menge unter 5 95 Jahren dargestellt als Histogramm wobei es diesmal jedes Jahr einzeln eine eigene Klasse ist und dann bekommen Sie dieses Bild und wenn sich jetzt angucken dann gibt es da jede Menge so auf und ab es also es gibt immer wieder so kleine Tiefpunkte Hochpunkte Tiefpunkte Hochpunkte der in großen Tiefpunkt das wir hier gibt großen hoch .punkt erwidern Horst Tiefpunkt und so weiter und Sie können sich jetzt auch überlegen was davon die sind einig reale Strukturen und was nicht also wenn sich überlegen Darstellungen der Altersstruktur der Mehr unter 95 Jahren im Jahr 2000 1 wissen sie gewisse Sachen ablesen können zum Beispiel ein 1. Weltbild Einfluss 2. Weltkrieg und dann können sich überlegen welche dieser Clique sind die Beiträge und was nicht und beziehungsweise das sind einfache Sachen vielleicht wollen sie auch was Neues erfinden und da was Neues finden wissen Sie sagen ok hier sieht dabei waren umgeschaltet
erst jetzt auf einmal ein Klick und die sind bekanntlich irgendeine Interpretation zu zuweisen es gibt aber dummerweise so viele hoch und Tiefpunkte das was gar nicht mehr genau weiß was einig davon wirklich in Daten ist und das jetzt günstig für diese Darstellung rein gemacht haben und was jetzt im Folgenden machen wollen er statt das so durch eine stückweise konstante Funktion zu beschreiben
wollen wir die Lage der Daten jetzt durch eine glatte Funktion beschreiben wie bisher dabei gelten 1. Funktionswerte nicht negativ zweitens gesamte Flächeninhalt ist 1 und 3. die Fläche über ein Intervalle soll ungefähr proportional zur Anzahl der Datenpunkte in denen dabei sein das geht natürlich nicht genau wenn überall in der weil die der der Flächeninhalt oder wenn zum Beispiel nur diesen einen der Länge 1 der Flächeninhalt genau gleich der ein der Daten oder proportional immer gleich der Flächeninhalt gleich der relativen Häufigkeit Daten vom den Wahl sein sollten dann würden sie mehr oder weniger wieder beim Histogramm enden und wieder beide unstetige Funktionen alles schaffen sie nicht deswegen steht ja nur ein ungefähr proportional ok er das was wir haben wollen formalisiert ich mit der Definition die auch in der weiteren Theorie der ganzen Geschichten dahinter steckt ein noch wichtig sein wird nämlich die Funktion der Dichte eine Funktion f Funktion von R nach R mit 2 Eigenschaften 1. die Funktion des 1 ist größer gleich 0 2. das Integral über ganz er über diese Funktion die heißt die Stätte Zieles wir wollen die Lage der Daten durch eine glatte nicht die Funktion beschreiben beschreiben in dem Sinne dass wir nicht die Dichte an Eindruck ich schnapp mir wurden der Intervall dann weiß ich ja vielleicht will die Anzahl die relative Häufigkeit der Punkte in diesem Intervall ist ungefähr gleich dem Flächeninhalt zwischen zwischen der Funktion und der x-Achse in diesem Intervall zur das möcht ich haben und gleichzeitig soll die Dichtefunktion glatt sein also gar nicht so gaben wir haben schon für einige in der Wale aber die Funktion war nicht leicht gut und sie fragen so weit ok sie habe nicht ganz verstanden was ich mit einer glatten funktionalen was es für mich eine glatte Funktion eine glatte Funktion es zum Beispiel eine differenzierbare Funktion für mich also die Ableitung schön existiert ja dem keine so komischen knicken oder insbesondere auch keine Sprung stellen ok weiter fragen ja das war nur ein wie machen wir
das der als 1. modifiziert unser bisheriges Vorgehen in dem ich ein sogenanntes kleiden das Histogramm bildet bei leidenden Histogramm erreiche ich den Funktionswert an einer Stelle x im Prinzip also zu bisher also ich nehmen in der Wahl QC Mehr an wie viel Punkte sind in dem die relative Anzahl der Datenpunkte in diesen in diesem Intervall und einen noch durch die Länge des Intervalls nur dieses Intervall bewegt sich jetzt mit dem X nicht dieses Intervall 10. wir ich jeweils um das X tun um das heißt ich hab ein Parameter hat größer 0 dann wenn ich den Funktionswert an der Stelle x haben möchte das Intervall von iX -minus habe x +plus QC an wie viel Daten .punkt sind arbeiten es gibt natürliche Zahl zwischen 1 0 und n Teil durch 1 und 1 noch durch die Länge des Wald und das sei einem Funktionswert also im Unterschied zum Histogramm von vorhin am beim gleichen Histogramm jetzt alle Daten Punkte die die gleiche Entfernung zu X haben den gleichen Einfluss auf den Funktionswert ok wenn ich deshalb schreibe ich ein bisschen um ich hab diesen ich zitiere dieses einst durch einen oder erstmal beziehen diesen Faktor 1 durch Elmar nach vorne und dann hab ich noch ein Faktor Einheit der steht hier und diese Anzahl der Datenpunkte x Sie in iX -minus H bis nächstes Jahr die reichlich n ähnlich jeden einzelnen Daten vom durch als in 1. 2. 3. 4. durchgehen und eine 1 nehme wenn dieser Daten .punkt in den Winterwald liegt in iX -minus habe Sixtus H 1 0 nehme wir nicht findet und diese Zahlen aufaddieren das heißt das ich hier mache ist die sogenannte Indikator Funktion diese Funktion 1 mit einer Menge und aus deren Funktion ist entweder 0 oder 1 siehst 1 falls dieser Punkt in der Menge drin legt um 0 sonst das heißt für jeden einzelnen .punkt achtjährig eine 1 auf einer belegt und nur laufen nicht Relikt welches wie alle Punkte mache bekomm ich gerade die Anzahl der Punkte das heißt diese Summe hier zum Ei gleich 1 bis n diese ganzen werde auf agiert ohne den Vater Einheit ist gerade diese Anzahl der EG sie im Intervall x -minus H bis nächstes hat ok ist dass dabei klar oder Fragen dazu an der wie wird sich die Einheit nicht auch noch aus weil ich das gleich umschreiben kommt gleich also was ich gleich machen ich werde gleich diese Formel etwas verallgemeinern indem ich dass da abstrakter anders schreibe mir überlege was hier eigentlich steht ist ja ich das darstellen als der Funktion von x diese Funktion hat gewisse Eigenschaften und dann werden wir sehen wenn ich deine dann kann ich eine andere Art von Funktion einsetzen und die ganze Sache verallgemeinern also noch bin ich aber Ziel nicht mehr ist auch dieses Leiden Histogramm wird und stetig sein als sehen Sie vielleicht Funktionswert wenn Sie es ein bisschen wackeln und wurde vom Sonntag anfangs springen ein Stück wenn nächste Daten .punkt also wenn sie ihm das Intervall von Felix habe es nächstes Jahr so verschieben dass ein einladen .punkt ausfällt oder ein anderer einfällt dann verändert sich das um 1 durch n mal 1 durch 2 Haar der Funktionswert und damit den sie lauter kleine Schwung stellen ok jetzt schreibe ich diesen diese Indikatorfunktion hier ich nutze aus dieser Funktion ist 1 genau dann wenn dieses XD in dem Intervall von iX -minus habe nächstes Jahr liegt ansonsten ist die 0 also nach Definition des heißt genau dann wenn X -minus Zahl kleiner gleich x sie kleiner gleich x +plus H ist und diese beiden Formeln und Gleichungen kann ich umformen ich kann er betrachten sie mal die Ungleichung X -minus hat leider gleich XE ich CX ab dann ist -minus hat gleich X Ines x ist multipliziere mit minus 1 durch eine Zahl größer gleich als X minus x nie ich teile noch mit hart durch 1 größer gleich X minus x die durch Haar gleiche mach ich wieder 2. Umformung das heißt ich die auf beiden Seiten des X ab Teil dann durch -minus dadurch und komme auf minus 1 kleiner gleich x -minus XE durch kleiner gleich 1 ich weiß dies ist klar so weit oder Phonds müssen sich jetzt beschweren und es ausführlich erklären also ich war zum bisschen blöd weil der sie sind ja in verschiedenen Semestern Hafeninsel noch im 1. Semester und für die ist vielleicht die Notation ein bisschen ungewohnt für diejenigen die natürlichen Farben Semester sind die sagen was macht der Cholera was erkläre eigentlich sicher sofort die Frage ok gekommen sind so Mahrer an wenn wir haben
X -minus H ist kleiner gleich x E kleiner gleich x +plus H ich 10 x ab steht damit das Haar kleiner gleich x e kleiner gleich war klar dass ich sie -minus x ich teile mit H durch entsteht -minus 1 kleiner gleich x -minus x durchs Haar kleiner gleich 1 da und wenn diese Zahl x 7 x durch H liegt im Intervall von minus 1 bis 1 belegt auch das negative dieser Zahl Intervall von minus 1 bis 1 das heißt wir können dazu ist der negative liegt trennen also entweder sie modifizieren die Ungleichung mit minus 1 durch den Kern sich beide ungleiches Zeichen um und dann schreiben Sie dann der anderen Reihenfolge durch unter anderen Reihenfolge dann schreiben Sie sie den anderen Reihenfolge gehen und sie machen sich einfach klar wenn die Zahlen in der Wahl von die Intervall von minus 1 1 liegt bei dieses dabei symmetrisch um die 0 ist liegt -minus 1 2 die Zahl genauso in dem in der Wanne das heißt wir haben hier ein -minus 1 kleiner gleich x -minus XI durchs Haar damit gleich 1 die Frage ist natürlich warum möchte ich diese Reihenfolge haben ich möchte diese Reihenfolge haben weil das vielleicht die üblichen rational geht für das was ich gleich einführen werden da tut man es üblicherweise in dieser Reihenfolge schreiben nicht andersrum ok jetzt sehen sie aber das kann ich jetzt auch noch so schreiben das der dass die Indikator Indikatorfunktion vom Intervall -minus 1 1 und hier und ich meine eigenen Notation nicht gut also 1 dabei -minus 1 1 was ich sehr dass ich sie durch war das ist genau dann zu erhalten erfüllt wenn diese Indikatorfunktion gleich 1 ist das heißt ich kann jetzt meine ursprüngliche Indikatorfunktion die ursprüngliche stand er Indikatorfunktion zum Intervall Felix -minus habe bis nächstes Jahr XP ersetzen durch den die Karte Funktion zu Bindewald -minus 1 bis 1 von X -minus XI durch Haar und das mach ich auf der nächsten Folie
und damit erhalten Sie dieses FN von X kann ich schreiben als einst durch NHH zum eh gleich 1 bis n k von X -minus XI durch H es kam es dabei die Indikatorfunktion wie hier auf der Tafel steht und noch der Faktor einhalten das heißt K von wer halt mal Indikatorfunktion zum Intervall von -minus 1 1 ausgewählt an der Stelle ok damit hab ich sorgen anders hingeschrieben ich habe eine Sache eingeführt bleiben das ist Programm war einigermaßen plausibel ich hab ein bisschen anders denn geschrieben mit neuen Symbolen aber es also nichts passiert Sie fragen so weit Druck geht es kommt der eigentliche Clou was würde es ganze sind der 1. ist kommen Sie mal die Funktion K an wie sieht die aus man sich überlegen sie Armierung vom das wir malen sie Graph von Urin was
passiert dann ja ja wir haben die in der Indikator zum Intervall von minus 1 bis 1 machen vielleicht viermal 1 machen wir -minus 1 hier halt das heißt die Funktion die gar nicht so aus und ich dort vielleicht eine Fahrt machen müssen es überhaupt sieht am und dann sehen sie sofort diese Funktion ist aber nicht negativ und die B Flächeninhalt bei dieser Funktion zwischen
X-Achse und Funktionsgraphen =ist gleich 1 ich dieses Rechteck hat der Grundseite Seite 2 Höheneinheiten also vielleicht Flächeninhalte zweineinhalb also gleich 1 das heißt diese Funktion die 4 zu 1 das heißt diese Funktion ist eine wichtige im Sinne von unserer vorigen Definition was ich dann mache ich wir an der Stelle eigentlich dieses einst durchschaubarer ins Ziel Funktion der Bauart 1 durch America von X -minus XI durch haben wenn sie das als Funktion von als Funktion von x betrachten sie dachten ich fest heißt auch fest was passiert dann mehr durch dieses XXI wird die Funktion einer verschoben zu das der Mittelpunkt der hier bei der 0 ist das sicher bei 0 liegt sondern bei XII liegt und anschließend durch dieses diese nicht eskalieren mit dem 1 durch H vorne und im Allgemeinen auch noch bei mit dem Haar vorne wurde gestaucht oder gestreckt aber es wird insgesamt so gemacht nach Ansicht relativ einfach klar da kommt ebenfalls eine dichte aus das heißt das Ganze was da oben steht kann ich jetzt dort als Mittelung von dichte Funktionen die und die einzelnen Datenpunkte konzentriert sind ich aber gucken dass ich ihn beim letzten nächsten Mal noch ein bisschen Software mitbringen Hamas und am schönsten illustrieren daran also schlugen dass man den Moment ok jetzt machen eine Verallgemeinerung von dem ganzen die Verallgemeinerung ist folgende wir die gleiche Formel nur setzen das K anstelle von den von der Einheit mal Indikator zum Intervall von minus 1 1 dieser ganz speziellen dichte setzen Sie jetzt eine beliebige dichte allen meistens eine dichte sein die um die um die 0 herum konzentriert ist also um die 0 herum hat die noch relativ große Werte wenn wir weiter weg kommen vom Nullpunkt sind weder die kleinen und dann bekommt man den so genannten Kern sich Schätze hat 2 Parameter das Haar so genannte Bandbreite und dieses K in sogenannten Beispiele für diesen Kern wären das was wir gerade eben hatten hier ist der sogenannte da naive kam wenn da jetzt einen glatten kann einsetzen eine glatte Funktion und das ganze Ding automatisch insgesamt eine glatte Funktion ich hab hier mal ein stetigen gern in sogenannten etwa Leschnikoff gern der es außerhalb Intervall von minus 1 1 gleich 0 innerhalb dieser 3 Viertel nach 1 -minus u Quadrat das geht insgesamt dann ist diese Funktion die hier steht stetig als Funktion von x das gesamte arithmetische Mittel auch oder sie neben den Garaus gern K von US 1 durch Wurzel 2 um das Quadrat Heide wer glauben Sie mir unterstellen wir dass der Vorfahrt das richtige ist dass das gesamte Integral gleich 1 ergibt das werden Sie meine Wahrscheinlichkeitstheorie aufbauen Vorlesung aussehen wenn sie noch nicht kennen wer als das auch eine dichte und das Leben Gedichte die fehlt also einen Nullpunkt ist sie Wert größer 0 und außerhalb von 0 fällt sie relativ schnell ab und das Ganze werden jetzt mal
an um die Altersverteilung der männlichen Einwohner unter 95 Jahren im früheren Bundesgebiet der BRD ohne Berlin bis West im Jahr 2000 einzuschätzen und dann bekommen Sie so was und da sehen Sie was ich jetzt neu aber ich habe es auf einmal eine glatte Funktion bekommen und Sie sehen eine Vielzahl von diesen maximal minimal die vor ab sind verschwunden und Sie können sich jetzt überlegen werde was bedeuten diese immer maximal minimal die überhaupt noch da sind was ist das hier was ist dieses maximiert haben Sie dafür mögliche Erklärung bis tiefer der 2. Weltkrieg sein also wenn sich überlegen das sind so die Leute sind so umgehen 55 R also als Sie geboren wurden war es so circa ja 1900 45 46 Sonnenbrille das macht sein ich durchaus sehen dass es nach dem nach dem Krieg oder Ende des 2. Weltkrieges die Geburtenrate ein eingebrochen ist das könnte was mit ihr das könnte was mir Vorfahren vor zu war Barrios darüber haben wir es halt aber es geht es geht in die Richtung das hat was mit der Empfängnisverhütung zu tun Einführung Empfängnisverhütung Einführung Empfängnisverhütung die Pille für die Frauen mehr das Wesentliche hier glaub ich nach dieses Leben oder singen sie ihren Abfall adipöse viele Frauen sehen sich auch irgendwo das ist sogenannter ein Defekt dieser Abfall anders ist er das macht der Schätzer künstlich aber ich dachte dass hier noch viel höher waren da abfällt hat was mit der Einführung der Empfängnisverhütung für Frauen zu tun was ok fragen der Randabfall ist es der Rand Abfall ist vollständig richtig der ist meines Herzens sind aber ins Leere läuft das heißt da müssen Sie umgerannt Modifikation machen um zu berücksichtigen das ist dass sie gar nicht also dass in dem ein Teil von ihm dabei gar keine Daten .punkt immer haben da geht's Modifikationen bei den Schätzer steht noch Fragen können damit ein können Sie von diesen Grafen die genaue Funktion bestimmen was man also die meinen dass ich in einer ländlichen schreiben was das ist als Funktion das ist eine Summe als eine Summe von vielen Funktionen vielen kleinen Funktionen ich ganz natürlich also man schreiben und sie können es problemlos am Rechner ausrechnen solche Sachen machen sie nur machen sich wieder Hand was machen sie mit dem Computer wiederum statistische buchen wenn Sie beim nächsten Mal was mit und für ein bisschen Software vor ich möchte mein letztes Bild zeigen der nämlich Einfluss der Bandbreite wenn Sie an Breite sehr
kleinmachen oder schätze sehr rau wenn sie Bandbreite sehr groß machen das alles wirklich mal weg entkleidet dazwischen sehen Sie mehr Struktur also brauchen und so einen ich wir brauchen einen richtigen Wert für die Bandbreite und das ist nicht ganz einfach also es die Bandbreite sehr klein zu Wort etwa als Funktion von x sehr stark schwanken ist dagegen H sehr groß so war er der Fahrer als .punkt erfahren nichts als Funktion von x kaum noch ok Damen welche die vorlesen wollte schließen wir sehen uns dann nächsten Mittwoch
Randomisierung
Beobachtungsstudie
Faktorisierung
Zusammenhang <Mathematik>
Randomisierung
Objekt <Kategorie>
Beobachtungsstudie
Menge
Randomisierung
Menge
Beobachtungsstudie
Durchschnitt <Mengenlehre>
Zahl
Teilmenge
Teilmenge
Menge
Stichprobe
Reihe
Größenordnung
Schätzung
Menge
Umfang
Stichprobe
Ziffer
Statistik
Punkt
Statistik
Reihe
t-Test
Formation <Mathematik>
Zahl
Richtung
Untergruppe
Verzerrung
Rechenbuch
Punkt
Durchschnitt <Mengenlehre>
Mechanismus-Design-Theorie
Verzerrung
Verzerrung
Statistik
Stichprobe
t-Test
Punkt
Durchschnitt <Mengenlehre>
Stichprobenumfang
Durchschnitt <Mengenlehre>
Stichprobe
Algebraisch abgeschlossener Körper
Ziffer
Punkt
Gewicht <Mathematik>
Statistik
Stichprobe
Statistische Analyse
Datenerhebung
Schätzung
Stichprobenumfang
Menge
Zahl
Mittelungsverfahren
Deskriptive Statistik
Zufallszahlen
Mittelungsverfahren
Verzerrung
Menge
Verzerrung
Schätzung
Stichprobenumfang
Ziffer
Struktur <Mathematik>
Stichprobe
Ziffer
Messgröße
Faktorisierung
Statistik
Länge
Punkt
Tabelle
Zahl
Unterteilung
Unterteilung
Variable
Menge
Stichprobe
Messgröße
Klasse <Mathematik>
Tabelle
Klasse <Mathematik>
Wertevorrat
Zahl
Unterteilung
Ordnungsrelation
Unterteilung
Histogramm
Histogramm
Kugel
Eigenwert
Ordnungsrelation
Stichprobenumfang
Tabelle
Abschätzung
Abstand
Messgröße
Folge <Mathematik>
Länge
Klasse <Mathematik>
Länge
Fläche
Wertevorrat
Wertevorrat
Balken
Histogramm
Histogramm
Flächeninhalt
Graphische Darstellung
Höhe
Diagramm
Flächeninhalt
Klasse <Mathematik>
Rechteck
Flächeninhalt
Darstellung <Mathematik>
Klasse <Mathematik>
Kante
Schätzung
Unstetige Funktion
Histogramm
Flächeninhalt
Menge
Unstetigkeit <Mathematik>
Schätzung
Mathematiker
Flächeninhalt
Graphische Darstellung
Struktur <Mathematik>
Fläche
Länge
Glatte Funktion
Dichte <Stochastik>
Differenzierbare Funktion
Fläche
Dichte <Stochastik>
Relationalsystem
Unstetige Funktion
Dichte <Physik>
Integral
Histogramm
Flächeninhalt
Flächeninhalt
Eins
Ableitung <Topologie>
Parametersystem
Länge
Faktorisierung
Punkt
Dichte <Physik>
Natürliche Zahl
Gleichungssystem
Termumformung
Zahl
Histogramm
Summe
Histogramm
Ungleichung
Menge
Strukturgleichungsmodell
Kerndarstellung
Faktorisierung
Flächeninhalt
Graph
Dichte <Physik>
Parametersystem
Glatte Funktion
Kerndarstellung
Momentenproblem
Dichte <Physik>
Modifikation <Mathematik>
Rechteck
Wahrscheinlichkeitstheorie
Kernfunktion
Richtung
Integral
Schätzfunktion
Arithmetisches Mittel
Mittelungsverfahren
Summe
Mittelungsverfahren
Quadrat
Rechenbuch
Flächeninhalt
Verallgemeinerung
Schätzung
Graphische Darstellung
Kerndarstellung
Verallgemeinerung
Funktion <Mathematik>
Glattheit <Mathematik>

Metadaten

Formale Metadaten

Titel Histogramme, Dichteschätzung
Serientitel Einführung in die Stochastik
Autor Kohler, Michael
Lizenz CC-Namensnennung - keine kommerzielle Nutzung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen und nicht-kommerziellen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen und das Werk bzw. diesen Inhalt auch in veränderter Form nur unter den Bedingungen dieser Lizenz weitergeben.
DOI 10.5446/34018
Herausgeber Technische Universität Darmstadt
Erscheinungsjahr 2011
Sprache Deutsch

Inhaltliche Metadaten

Fachgebiet Mathematik

Ähnliche Filme

Loading...
Feedback