Lineare Regression
This is a modal window.
The media could not be loaded, either because the server or network failed or because the format is not supported.
Formal Metadata
Title |
| |
Title of Series | ||
Part Number | 5 | |
Number of Parts | 25 | |
Author | ||
License | CC Attribution - NonCommercial - ShareAlike 3.0 Germany: You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal and non-commercial purpose as long as the work is attributed to the author in the manner specified by the author or licensor and the work or content is shared also in adapted form only under the conditions of this | |
Identifiers | 10.5446/34020 (DOI) | |
Publisher | ||
Release Date | ||
Language |
Content Metadata
Subject Area | |
Genre |
1
3
5
6
7
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
00:00
VelocityPoint (geometry)StochasticOrder of magnitudeDirection (geometry)Computer animationDiagram
03:46
MedianScatteringVarianceMaximum (disambiguation)Greatest elementLengthLinieQuantileLinear regressionSummationQuantileLengthGreatest elementMittelungsverfahrenMaximum (disambiguation)VariancePhysical quantityScatteringModulformSummationOutlierLinear regressionLine (geometry)MedianSquareStatistische MaßzahlLinieComputer animation
05:28
StochasticMathematische FakultätComputer animation
06:37
AutocovarianceLine (geometry)Point (geometry)SummationSquareVarianceArithmetic meanAutocovariancePolynomialDerived set (mathematics)Potenz <Mathematik>Logical constantReal numberGlatte FunktionFactorizationFunction (mathematics)Variable (mathematics)Graph minorFluxSequenceConnected spaceZahlNumberChain ruleEquationComputer animationLecture/ConferencePanel painting
16:35
SummationEquationExponentiationAutocovarianceVariable (mathematics)MathematicianTermumformungLösung <Mathematik>SquareLinear equationCoefficientSystem of linear equationsArithmetic meanCorrelation and dependenceFactorizationNichtlineares GleichungssystemMittelungsverfahrenLecture/Conference
25:44
SummationNumberEquationTerm (mathematics)SummierbarkeitFactorizationVarianceSquareStarke KopplungLogical constantNichtlineares GleichungssystemModulformAutocovarianceLecture/Conference
34:53
AutocovarianceStatisticsFactorizationLine (geometry)TheoryZusammenhang <Mathematik>StatisticsSign (mathematics)Correlation and dependencePropositional formulaAutocovarianceStatistische MaßzahlSquareHöhePlane (geometry)Computer animation
44:13
Binomische FormelSquareTerm (mathematics)NumberFactorizationSummationAutocovariancePlane (geometry)Propositional formulaCarry (arithmetic)Lecture/Conference
51:47
Term (mathematics)SquareFactorizationSign (mathematics)Correlation and dependenceKovarianteAutocovarianceGradientVarianceNumberLecture/Conference
59:21
SummationZusammenhang <Mathematik>VarianceLine (geometry)Correlation and dependenceSign (mathematics)FactorizationSquareNumberAutocovarianceTermumformungLinear regressionModulformMultiplicationPropositional formulaLecture/Conference
01:06:55
Linear regressionMathematicsRegressionsschätzungMathematical optimizationSummationAtomic nucleusZusammenhang <Mathematik>WeightLinear regressionLineare FunktionSquareArithmetic meanState of matterSmoothingDichteschätzungFilm editingCorrelation and dependenceMittelungsverfahrenMean-Field-TheorieFactorizationPropositional formulaLine (geometry)Function (mathematics)PolynomialEstimationGlattheit <Mathematik>Derived set (mathematics)Adaptive behaviorRegressionsschätzungAutocovarianceNumberMathematical optimizationMathematicsEstimatorArithmeticEstimatorAverageHöheSummationAtomic nucleusZusammenhang <Mathematik>KernschätzungCalculationKernfunktionAbsolute valueGAUSS (software)Continuous functionPopulation densityLinieScale (map)Local ringDirection (geometry)StreckeParameter (computer programming)Computer programmingComputer animation
Transcript: German(auto-generated)
00:01
präsentiert von Open Learnware, die Plattform für Lernmaterialien an der TU Darmstadt. Ja, ich begrüße Sie recht herzlich zur heutigen Vorlesung in der Einführung in die Stochastik. Ich habe Ihnen erstmal die Auswertung von der Umfrage vom
00:39
Mittwoch mitgebracht. Ich hatte nach zwei Sachen parallel gefragt, nämlich ob
00:44
die Vorlesung von der Geschwindigkeit her zu schnell oder zu langsam. Das gab die y-Koordinate eines Punktes oder ob sie vom Schwierigkeitsgrad her zu schwer oder zu leicht war. Das gab die x-Koordinate eines Punktes und den entsprechenden Punkt sollte man in dieses zweidimensionale Koordinatenkreuz
01:02
einzeichnen. Mich hat hinterher jemand gefragt, was ich eigentlich überhaupt mit der Umfrage mache, ob das irgendwelche Auswirkungen auf die Vorlesung hat. Ich war dann spontan etwas erstaunt, aber es ist eigentlich klar, habe es glaube ich auch nicht richtig beantwortet, es ist klar, es hat natürlich Auswirkungen auf die Vorlesung. Ich möchte eigentlich gerade sehen, ob ich viel zu schnell oder viel zu langsam bin und würde es dann
01:21
korrigieren. Bei der gegenwärtigen Vorlesung ist mir klar, dass ich eigentlich tendenziell die ganze Vorlesung ein bisschen zu leicht und zu langsam ist. Das kam jetzt bei der Befragung gar nicht so arg raus, hat natürlich damit zu tun, dass Sie auch nicht unbedingt die ehrliche Antwort sagen, sondern Ihre Antwort wird einen gewissen Bias haben in
01:43
die obere Richtung, weil Sie eben sonst befürchten, sonst macht der Cola schneller und macht es schwieriger. Das ist auch klar, aber so wie es aussieht, sieht es eigentlich ganz gut aus, also einigen wenigen war es zu schwer und zu schnell, aber vielen war es zu leicht und zu langsam. Aber das gibt sich im Laufe der Zeit von allein. Es kamen dann einige
02:03
Anmerkungen, auch das ist Sinn der Vorlesung um Frage, eigentlich speziell auch Anmerkungen zu sammeln oder Ihnen noch die Gelegenheit zu geben, zu fragen. Eine Anmerkung war, oder eigentlich dreimal kam die Anmerkung mit 25 Minuten früher Schluss, ich glaube es waren 15 Minuten früher, aber so die Größenordnung war richtig. Ja, ich habe früher
02:23
aufgehört, da ich mit den Folien nicht zu viel erzählen will. Das heißt dahinter steckt, dass es mir eigentlich nicht darauf von aus, dass es mir eigentlich nicht wichtig ist, was ich hier erzähle, sondern mir ist wichtig, was Sie hier verstehen und meines Erachtens ist Ihre Aufnahmefähigkeit begrenzt. Das heißt, wenn ich Sie anderthalb
02:41
Stunden lang mit Folien zu lade, dann kriegen Sie eben ein Viertel oder das Drittel nicht mit. Das heißt, ich kann weiter erzählen, aber ich bringe Ihnen nicht mehr stofffrei. Deswegen, solange ich so Folien verwende, wird heute zum letzten Mal sein, werde ich auch durchaus mal früher Schluss machen. Das kann schon sein. Es kann auch sonst mal
03:01
sein, dass ich mal 10 Minuten früher aufhöre, einfach, weil der Schluss muss im Prinzip passen vom Inhalt her. Das hat keinen Sinn, dass ich mitten im Beweis aufhöre und dann im nächsten Mal noch mal von vorne anfangen. Sonstige Anmerkungen, eine schöne Anmerkung war, leichte Themen zu langsam, schwere Themen zu schwer.
03:24
Also, als ich das gelesen habe, habe ich gedacht, das habe ich ja gründlich falsch gemacht. Aber der zweite Satz war dann insgesamt eine sehr ansprechende Vorlesung. Ich weiß nicht, ob ich irgendwas falsch gelesen habe oder so. Also irgendwie fast der erste Satz, nicht zum zweiten. Und dann kam noch zweimal sowas wie der zweite Satz, sehr anschaulich, angenehm zu folgen.
03:41
Strukturierung der Vorlesung ist gut. Fragen waren überhaupt keine. Ok, soweit zur Umfrage. Zweite Sache. Wiederholung zur Vorlesung am Mittwoch. Die Mitte der Daten wird durch Lagemaßzahlen
04:01
wie empirisches arymetisches Mittel und Median beschrieben. Die Streuung der Daten um den mittleren Wert geben Streuungsmaßzahlen wie empirische Varianz und Interquartalsabstand an. Also von den Formeln her, ich habe Ihnen glaube ich schon mal gesagt, bei der Klausur wird es keine Hilfsmittel geben. Ich gehe davon aus, dass Sie wissen, wie man ein empirisches arymetisches Mittel berechnet, auch ein Median und wie man
04:23
eine empirische Varianz berechnet und wo man manche dieser Größen im Boxplot findet. Das wären eigentlich die Sachen, die Sie hier brauchen. Kommt schon der zweite Punkt. Ein Boxplot beschreibt eine Datenmenge durch Angabe von Median. Das ist die mittlere Linie. Erstes und drittes
04:42
Quartil enden der Box. Länge ist der Interquartalsabstand sowie den von Ausreißern bereinigten Maximum Minimum der Daten. Wenn Sie Boxplots vergleichen mit Hilfe oder wenn Sie Daten vergleichen mit Hilfe von Boxplots so rum, dann sollten Sie eben nicht nach dem Maximum Minimum gucken,
05:01
auch nicht nach den Ausreißern, sondern Sie sollten nach diesem ersten dritten Quartil und den Medians gucken, weil das die einigermaßen robusten Beschreibungen der Daten sind. Und dritter Punkt, da machen wir heute weiter. Bei der linearen Regression passt man eine gerade so angegebene Punkte an, dass die Summe der Quadrate der Abstände zwischen den Y-Werten der Punkte und den Y-Werten
05:22
auf der Geraden minimal ist. Da hatten wir beim letzten Mal noch ein. Ja, da hatten wir beim letzten Mal noch ein die Folie dazu. Das war die Folie Nummer 98.
06:02
Das geht so nie. Dann machen wir es doch so.
06:29
Also wir waren hier stehen geblieben. Formel für die Regressionsgrade hatten wir hergeleitet oder wir hatten es noch nicht hergeleitet, sondern ich hatte es nur angegeben, hatte gesagt, ich leite es dann diese Vorlesung her.
06:41
Also diese Regressionsgrade, die gerade die Summe der Quadrate der Abstände von den Punkten auf der Geraden zu den Datenpunkten minimiert, ist gegeben durch die folgende Formel Y gleich A Dach mal X minus X quer plus Y quer. X quer, Y quer sind die arithmetischen
07:03
Mittel. A Dach ist ein S X Y durch S X Quadrat. S X Quadrat ist die empirische Varianz von X und Y. S X Y ist die sogenannte empirische Co-Varianz der zweidimensionalen Messreihe, definiert als eins durch N minus eins Summe I gleich eins bis N X I minus X quer mal Y I minus Y quer. Und das möchte
07:22
ich Ihnen jetzt dann zeigen. Und das machen wir an der Tafel. Also könnten Sie soweit mitschreiben.
07:46
Okay, was möchte ich machen? Ich betrachte eine Funktion von zwei Variablen. Das war dieses kleinste Quadratekriterium. Also Summe I gleich eins bis N Y I minus in Klammern A mal X I plus B und das
08:04
Ganze zum Quadrat. Und was wir machen möchten,
08:30
ich möchte diese Funktion bezüglich A und B minimieren. Ich schreibe es mal so hin. Das heißt,
08:42
ich suche reelle Zahlen A und B, sodass dieser Ausdruck seinen kleinstmöglichen Wert annimmt. Der Trick dazu, Wertzahl von Ihnen wird ihn schon kennen, ist der folgende. Also wir haben
09:02
jetzt hier eine zweidimensionale Funktion, die wir minimieren wollen, eine Funktion von zwei Veränderlichen. Sie kennen das alles aus der Schule mit Funktionen von einer Veränderlichen. Setzen Sie die Ableitung einfach gleich Null. Bei Funktionen von zwei Veränderlichen machen Sie Folgendes. Sie nehmen an, Sie sind in der Minimalstelle A und B und variieren eine von den beiden Komponenten. Wenn ich eine
09:21
von den beiden Variablen variiere und ich gehe aus der Minimalstelle mit dieser Variablen raus, dann wird der Funktionswert größer gleich. Das heißt, wenn es wirklich die Minimalstelle ist, dann hat die eindimensionale Funktion, wenn ich eine der beiden Werte hier durch eine Variable
09:41
ersetze und das als eindimensionale Funktion betrachte, dann hat sie für diesen Wert dieser Variablen eine Minimalstelle. Also ist A, B Minimalstelle von F, so haben die
10:05
folgenden beiden Funktionen. Ich betrachte eine Funktion F1 von U, die ich ersetze, die ich bekomme, wenn ich bei der Funktion F von A, B das A durch U ersetze. Das
10:21
wäre F von U, W, beziehungsweise als zweites, ich betrachte eine Funktion F2 von V, das wäre F von A, V. Dann haben
10:44
diese Funktionen Minimalstellen für U gleich A beziehungsweise V gleich B. Und
11:23
wenn Sie sich jetzt diese Funktionen angucken, was ist F von U, B, das wäre die Summe I gleich 1 bis N, YI minus U mal XI plus B zum Quadrat. Und das als Funktion von U betrachten, dann sehen Sie, ja, das N ist eine feste Zahl, die Y1 bis YN sind feste, reelle
11:40
Zahlen, die X1 bis XN sind feste, reelle Zahlen und B ist eine feste, reelle Zahl. Das heißt, wir haben eine Funktion von nur einer veränderlichen und das Ganze ist eigentlich ein Polynom in dieser veränderlichen, das heißt eine wunderschön glatte Funktion. Dann wissen Sie, eine notwendige Bedingung für eine
12:00
Minimalstelle ist dann, dass die Ableitung verschwindet an der Stelle U gleich A. Das heißt, daraus folgt 0 ist gleich F1 Strich von A und diese Ableitung können wir natürlich
12:20
hinschreiben. Das heißt, ich leite die Summe ab, Ableitung der Summe ist die Summe, ist die Ableitung, ist die Summe der Ableitungen. Ich leite das Quadrat ab mit der Kettenregel. Also ich betrachte das Ganze als Funktion von U, wobei das A durchs U ersetzt wird, setzt man mit der U gleich A ein, leite es mit der
12:40
Kettenregel ab, zweimal den Ausdruck hoch 1, mal die innere Ableitung. Also ich komme auf Summe I gleich 1 bis N, dann zweimal vom Exponenten und die Basis abgeschrieben. Und dann
13:07
brauche ich noch die innere Ableitung, das heißt, ich brauche die Ableitung von YI minus in Klammern U mal XI plus B nach U und setze für U gleich A ein. Ja, dann sehen Sie, das ist eine
13:22
Konstante, fliegt weg, das B ist auch eine Konstante, fliegt weg und dieses Minus U mal XI abgeleitet gibt ein Minus XI und Sie haben das. Analog
13:41
bekommen Sie das Zweite, Null ist gleich F2 Strich von B. Wenn Sie sich überlegen, was ändert sich jetzt? Naja, bei der inneren Ableitung anstelle
14:01
diesen Faktor minus A mal XI leite ich den Faktor minus B ab. Und zwar oder ich kann so sagen, anstelle von minus U mal XI nach U abzuleiten, leite ich bei der inneren Ableitung minus V nach V ab. Das heißt, die innere Ableitung gibt einfach einen Minus 1, Rest bleibt gleich. Okay, Fragen soweit?
14:55
Wir schreiben es mal ein bisschen schöner hin. Also, oder Frage? Keine Frage, wir
15:01
schreiben es mal ein bisschen schöner hin, so dass man sieht, um was es sich eigentlich handelt. Ich kurz vielleicht mal mit minus 2, also es ist ja gleich Null, das heißt, wenn ich die Gleichung durch minus 2 teile, bleibt sie immer noch stehen, dann kann ich die 2 hier vergessen und die Minus kann ich auch jeweils vergessen. Dann
15:24
haben Sie, können Sie das XI rein multiplizieren und die Summe auseinander ziehen, bekommen Sie auf die Summe der XI mal YI minus Summe von A mal XI² minus, noch mal minus, weil das minus steht ja vor
15:41
der Klammer, deswegen gibt es auch eine Minussumme B mal XI. Die Faktoren A und B können Sie aus der Summe jeweils rausziehen. Ich teile die Summe noch jeweils durch 1 durch N und bringe das mit A und B auf die eine Seite, den Rest auf die andere Seite und erhalte dann A mal 1 durch N
16:15
XI² plus B mal 1 durch N I gleich 1
16:24
bis N XI, das ist gleich 1 durch N Summe I gleich 1 bis N XI mal YI. Also ich habe die de facto durch
16:42
minus 2 N geteilt und dann alles mit A und B auf die eine Seite gebracht, alles mit, alles andere auf die andere Seite. Da steht A mal 1 durch N
17:03
Summe I gleich 1 bis N XI² plus B mal 1 durch N Summe I gleich 1 bis N XI ist gleich 1 durch N mal Summe I gleich 1 bis N XI mal YI. Umformung klar soweit oder? Was ist jetzt mit
17:24
dem A und B passiert? Das A war hier, ich habe es einfach aus der Summe rausgezogen. Okay, wie komme ich, was ist das hier eigentlich? Ja, das ist eine Gleichung. Ich habe ursprünglich der
17:40
ganze Ausdruck ist gleich Null und ich habe den umgewandelt, indem ich einen Teil auf die eine Seite geschafft hat, den anderen auf die andere Seite. Dann habe ich eine Gleichung. Gleichung mit zwei Unbekannten. Okay? Ja, wenn Sie das Gleiche mit der zweiten Gleichung machen, was kommt dann raus? Kann mir vielleicht jemand
18:05
von Ihnen sagen, einfach die erste
18:27
Gleichung durch XI geteilt, weil da fällt ja ein Faktor XI. Vollständig richtig. Das heißt, wir schreiben das ganze noch mal ab, aber teilen alles durch XI, das heißt ich kann nicht sagen, ich teile durch XI, weil ich kann die Summe nicht durch XI teilen, aber eben überall nehme ich
18:42
bei XI eine Potenz weniger. Das heißt, hier steht XI hoch 1, hier steht XI hoch Null, 1 und hier steht nur die Summe der YI. Das heißt, wir kommen bei der zweiten Gleichung auf A mal A mal 1 durch N, Summe I gleich 1 bis NXI plus B mal, ja, B mal 1
19:06
durch N, Summe I gleich 1 bis N, 1. Wenn Sie von I gleich 1 bis N einsummieren, bekommen Sie N, teilen Sie wieder durch N, bleibt 1 stehen. Das heißt, es gibt einfach B mal 1
19:20
gleich 1 durch N, Summe I gleich 1 bis N, YI. Ich bezeichne die erste Gleichung mal mit 1, die zweite Gleichung mit 2 und dann sehen Sie,
19:45
was Sie eigentlich vorliegen haben, sind zwei lineare Gleichungen für zwei Unbekannte, also ein lineares Gleichungssystem mit zwei Unbekannten. Und wir suchen alle Lösungen dieses linearen
20:00
Gleichungssystems und es wird sich herausstellen, wir finden nur eine. Also es könnte hier keine Lösung geben, es könnte hier eine Lösung geben, es könnte unendlich viele Lösungen geben, für diejenigen, die schon ein bisschen mehr Mathematik gemacht haben. Okay, jetzt wie machen
20:21
Sie das? Naja, am einfachsten, wir sehen sofort aus zwei, wie B in Abhängigkeit von A aussieht und setzen dann den Wert in 1 ein und lösen nach A auf. Also aus zwei folgt, B ist gleich, ja ich mach
20:46
gleich ein bisschen Abkürzungen, ich schreibe mal y quer minus x quer, wobei y quer das arithmetische Mittel der yi ist und x quer das arithmetische Mittel der xi. Und dann setzen wir
21:16
das in 1 ein, in 1 einsetzen.
21:27
Habe ich nicht das A vergessen, ja Sie haben vollständig recht, ich habe das A vergessen, weil es auf der linken Seite von zwei steht ja A mal x quer. Das heißt, hier steht, danke schön. Also ich
21:41
drücke jetzt B als Funktion von A aus, setze es dann in 1 ein und habe dann nur noch eine Gleichung für eine Unbekannte. Also wir kommen auf A mal, für B setze ich
22:09
y quer minus x quer ab ein, dieses 1 durch n Summe i gleich 1 bis n xi ist x quer und die
22:25
rechte Seite schreibe ich wieder ab.
22:49
Okay, jetzt können Sie hier auflösen nach A. Sie können die mit A zusammenfassen, dann sehen Sie, da steht eigentlich A mal 1 durch n Summe i gleich 1 bis n x
23:01
i Quadrat minus x quer in Klammern zum Quadrat ist gleich, das kann ich auf die andere Seite bringen, 1 durch n Summe i gleich 1 bis n x i y i minus x quer mal y quer. Ich teile mal durch den
23:22
Vorfaktor von A durch, komme auf A gleich, gerade wusste ich es noch, also rechte Seite, das durch den
23:50
Vorfaktor von A, Vorfaktor von A war 1 durch n mal Summe i gleich 1 bis n x i Quadrat minus x quer in
24:07
Klammern zum Quadrat und damit habe ich eigentlich meine
24:22
Koeffizienten. Ich habe das A bestimmt und ich kann das A jetzt in die Gleichung unterhalb von 2 einsetzen und bekomme auch das B und fertig. Haben Sie Fragen so weit? Keine Fragen. Ich forme es
25:03
jetzt noch ein bisschen um, bei mir geht es eigentlich gar nicht darum, diese Grade, diese Gradengleichung zu bekommen, sondern ich möchte diese Gradengleichung am Schluss interpretieren und da bietet sich an, die Koeffizienten noch ein bisschen schöner hinzuschreiben. Also ich werde ausgehend von der Größe, die bei der Steigung dieser
25:22
Regressionsgraden auftaucht, eine neue Größe einleiten, die einführen, die ich dann später statistisch interpretieren werde, die sogenannte empirische Kovarianz und die empirische Korrelation. Okay, also wir schreiben, ich mache mal eine folgende Umformung mit und zwar
25:43
gucke ich mir mal an 1 durch n mal Summe i gleich 1 bis n x i minus x quer mal y i minus y quer. Diesen Ausdruck möchte
26:05
ich umformen und ich behaupte, dieser Ausdruck ist, oder Sie werden gleich sehen, dieser Ausdruck stimmt mit dem Nenner, mit dem Zähler bei der Formel für a überein. Okay, warum ist es so? Na ja, Sie multiplizieren einfach mal
26:21
aus, ziehen die Summe auseinander, ziehen konstante Terme aus der Summe raus, kommen auf was? Na ja, wir kommen auf vier Summen. Wir kommen auf vier Summen, wir haben keinen Platz für vier Summen, wir schreiben drunter weiter. Erstens wäre das x i mal y i, dann habe ich, bekomme
26:42
ich als zweites x i mal minus y quer, ich ziehe das minus y quer gleich raus aus der Summe, dann als drittes bekomme ich auch minus x quer mal y i, da ziehe ich das x quer genauso raus. Und als viertes,
27:08
wenn ich ausmultipliziere, bekomme ich minus x quer mal minus y quer, also x quer mal y quer. Das ist eine Konstante, ziehe ich aus der Summe raus, dann bleibt noch eins durch n mal Summe i gleich eins bis n, eins stehen, was eins ergibt.
27:22
Also gibt es einfach noch plus x quer mal y quer. Haben Sie eine Frage? Also
27:47
ob um die Summenzeichen eine Klammer muss, im Prinzip würde man das so nicht machen, weil man sagen würde, also die würde man sich implizit denken. Die Summe per se hat eine stärkere Bindung als dieses
28:01
Multiplikationszeichen. Also diese Summe ist eine Abkürzung für einen festen Ausdruck, und dieser Ausdruck wäre die Summe der x i in Klammern. Okay, ja, ja, ja.
28:20
Nein, ich hatte die eins durch n jeweils als Faktor, da haben Sie recht. Sonst hätte ich eins durch n auch noch ausklammern können, ja. Möchte ich aber nicht. Warum sehen Sie gleich, ich mache das deswegen nicht, weil das da ist jetzt x quer, das da ist y quer. Und dann sehen Sie, dann steht da eigentlich eins durch n mal Summe i gleich
28:41
eins bis n x i mal y i. Dann erst minus x quer mal y quer, dann noch mal minus x quer mal y quer, dann plus x quer mal y quer. Das heißt, das ergibt genau den Zähler von oben.
29:10
Damit haben wir das. Kriegen Sie die auch? Okay.
29:26
Dann machen wir hier weiter. Und weiter, wenn ich jetzt in dieser Gleichung die x i durch die x, durch die die y i durch die x i ersetze und entsprechend das y quer durch x quer, dann bekomme ich
29:42
ebenfalls eins durch n Summe i gleich eins bis n x i minus x quer ist dem Ausdruck da unten mit den y jeweils
30:02
durch die x ersetzt.
30:24
Also wie oben mit y statt x. Also im Prinzip, Sie können es auch nochmal nachrechnen, aber ich kann direkt die Formel von oben nehmen und einfach die y i gleich den x i setzen.
30:42
Ja, damit folgt jetzt die folgende Darstellung für uns A. A ist gleich. Ich habe den Zähler und Nenner umgeschrieben. Ich ersetze Zähler und Nenner durch die neuen Formeln.
31:01
Ich lasse bei dem 1 durch n noch ein bisschen Platz. Warum? Sehen Sie gleich. Ich habe hier noch ein bisschen Platz.
31:31
Und warum habe ich Platz gelassen? Ich habe darum Platz gelassen, weil wenn ich unten statt dem Vorfaktor 1 durch n 1 den Vorfaktor 1 durch n minus 1 hätte, dann würde ich
31:41
den unteren Ausdruck schon kennen. Das wäre unsere empirische Varianz, was wir eingeführt haben. Das heißt, wir schreiben hier mal 1 durch n minus 1. Und das ist dann das Gleiche, wenn ich oben auch noch 1 durch n minus 1 schreibe, weil die beiden Faktoren 1 durch n minus 1 im Zähler und Nenner kurzen sich, genauso wie die beiden Faktoren 1 durch n.
32:04
Und dann sehen Sie, das ist unsere empirische Varianz und das andere definieren wir neu. Das andere gibt die sogenannte empirische Co-Varianz. Das heißt, wir definieren das da als Sx² haben wir schon eingeführt durch Sxy.
32:26
Also ich habe damit diesen Ausdruck Sxy, die sogenannte empirische Co-Varianz, neu eingeführt. Den anderen hatten wir schon. Das andere war Sx, S index x zum Quadrat war die empirische Varianz von x.
32:49
Ja, und damit haben wir eigentlich die Gleichung für unsere Regressionsgrade. Weil diese Grade, die daraus kommt, heißen dann Regressionsgrade.
33:07
Und die Gleichung war y ist gleich Steigung a. Also a, ich schreibe es mal vielleicht direkt so hin,
33:20
Sxy durch Sx² mal x. Und dann eigentlich plus b. Unser b war jetzt das y-Quer minus x-Quer mal a. Das heißt, das minus x-Quer mal a
33:40
fasse ich im ersten zusammen, indem ich da noch minus x-Quer schreibe. Dann habe ich insgesamt einen Faktor minus x-Quer mal die Steigung noch hingeschrieben. Und ich muss noch ein plus y-Quer machen.
34:25
Es macht nicht immer Sinn, mit aller Gewalt eine Grade rein zu klopfen. Ja, kommen wir gleich zu. Oder am Ende der Vorlesung. Wenn Sie nichts dagegen haben, würde ich die Frage dann zurückstellen. Wir klopfen gerade mit aller Gewalt eine Grade rein. Aber warum das sinnvoll ist oder warum das was,
34:41
wann das nicht sinnvoll ist, das überlegen wir uns dann nochmal. Okay, sonst noch? Nachdem ich die eine Frage schon so umfassend beantwortet hab, noch weitere Fragen.
35:02
Okay, und das war genau die Formel, die wir hier hatten. Also y ist gleich a-Dach mal x minus x-Quer plus y-Quer. Wobei dieses a-Dach ist eben das Sxy durch Sx-Quadrat. Sxy wird als empirische Kurvarianz der zwei dimensionalen Messreihe bezeichnet.
35:21
Die empirische Kurvarianz, ich geh nochmal kurz zurück. Die empirische Kurvarianz sehen Sie hier. Also die Steigung dieser Geraden ist ja die empirische Kurvarianz durch Sx-Quadrat. Sx-Quadrat ist immer größer gleich Null.
35:42
Also die empirische Kurvarianz hat das gleiche Vorzeichen wie diese Gerade. Das heißt, empirische Kurvarianz ist eine statistische Maßzahl, die Aussagen macht über das Vorzeichen der Regressionsgraden. Ist die empirische Kurvarianz
36:01
positiv, so ist auch die Steigung der Regressionsgraden positiv bzw. ist die empirische Kurvarianz negativ, so ist auch die Steigung der Regressionsgraden negativ. Sie sehen es hier nochmal im Beispiel.
36:28
Das war die Gerade, die wir jetzt an die Daten zu den 16 Bundesländern oder zu der Arbeitslosenquote
36:42
und der Wochenarbeitszeit in den 16 Bundesländern der BRD im Jahr, 2002 war es, angepasst haben. Wenn Sie das Ganze jetzt mal versuchen zu interpretieren. Also wir haben da jetzt in der Tat eine Gerade reingeklopft. Jetzt gucken wir mal, was können wir denn darüber aussagen? Sehen Sie,
37:00
wie würden Sie das Bild jetzt interpretieren? Was haben Sie durch die statistische Analyse oder durch die Anpassung dieser Geraden gelernt?
37:23
Vorschläge. Was ist nochmal die x- und die y-Achse? Die x-Achse ist die Wochenarbeitszeit von 37 bis 40 Stunden pro Woche. Die y-Achse ist die Arbeitslosenquote von so 7 bis 20 Prozent.
37:46
Sie würden es so interpretieren. Aus einer höheren Wochenarbeitszeit folgt eine höhere Arbeitslosenquote. Das heißt, es wäre ganz klar. Wir hatten ja diese zwei Theorien aus der Volkswirtschaftslehre. Das war diese wäre diese Theorie unterstützt, dass es eben
38:01
so einen globalen Kuchen von Arbeit gibt und es gibt eben so einen Kuchen von Arbeit und wenn man die Wochenarbeitszeit erhöht, dann verrichten die gleiche Arbeit eben weniger. Okay, ich zeige Ihnen vielleicht einfach mal das nächste Bild dazu.
38:21
Das nächste Bild. Ich lasse die. Ja, oder vielleicht können Sie mir sagen, was würden Sie vermuten? Zu welchen Bundesländern gehören die Datenpunkte hier rechts oben? Hätten Sie irgend einen Vorschlag?
38:40
Das ist die ehemalige DDR, also Ostdeutschland. Haben Sie noch einen Vorschlag, was das hier ist? Nordrhein-Westfalen, ne? Ja, einer von diesen Stadtstaaten. Bremen oder Saarland?
39:01
Oder auch Saarland. Bin mir nicht ganz sicher. Ich müsste noch mal nachgucken. Okay, wir lassen jetzt mal die alten Bundes. Zwei, vier, fünf. Wir lassen mal. Ja, da war es auch Berlin. Wir werden gleich mal gucken. Also ich lasse mal die
39:20
die neuen Bundesländer weg. Nee, es war in der Tat, es war Berlin noch, ne? Da drüben wahrscheinlich. Sie lassen die. Also es war auch eines von den neuen Bundesländern. Saarland haben Sie wahrscheinlich da oben bei 14. Also es war aber nicht bei 20. Sie lassen die neuen Bundesländer weg. Und wir kommen jetzt diese grade.
39:41
Wie würden Sie das Bild jetzt interpretieren? Jetzt ist es genau andersrum. Je höher die Wochenarbeitsstunden, desto weniger Wochenarbeits. Je weniger die Wochenarbeitsstunden, desto geringer ist die Arbeitszeit.
40:01
Das heißt, wir haben genau diese zweite Theorie unterstützt. Die Arbeit wird in weltweiter Konkurrenz vergeben. Und das jenige Land, das besonders billig produziert, bekommt besonders viel davon. Deswegen. Und wenn Sie die Wochenarbeitszeit erhöhen, produzieren Sie billiger. Ja, also gut, Sie können jetzt
40:20
in Talkshows gehen mit beiden Thesen und in der einen Woche die eine vertreten, in der anderen Woche die anderen. Sie haben beides mal Daten dazu. Ja, aber wie interpretieren Sie das jetzt? Also wir haben die gerade reingeklopft. Auch zwei verschiedene Arten
40:42
und wir haben zwei verschiedene Antworten. Ok, Sie schlagen einfach vor, es gibt zwei verschiedene Datensorten und es ist eben
41:00
nicht sinnvoll, die gemeinsam in einer Statistik zu bewerten. Das ist eine Möglichkeit. Sonstige Möglichkeiten.
41:27
Also jetzt kommt der Schichtwort Beobachtung, Studie und konfrontierende Faktoren. Und das geht im Prinzip in die gleiche Sache. Wir haben etwas nur beobachtet und wenn wir nur beobachtet beobachten, können wir eben schlecht auf, was wir eigentlich zurückschließen wollen. Gerade sind
41:40
kausale Zusammenhänge. Wir können eben schlecht auf kausale Zusammenhänge zurückschließen. Wir müssten eigentlich eine saubere, kontrollierte Studie machen. Sie nehmen die Hälfte der Bundesländer, stecken sie in die eine Sorte, die andere in die andere Sorte. Beim einen erhöhen sie dir die Wochenarbeitszeit, beim anderen senken sie ab, warten zehn Jahre ab und gucken mal, was passiert. Aber können sie schlecht durchführen.
42:03
Aber das ist eines der Grundprobleme, das sie einfach in Wirtschaftswissenschaften haben. Die meisten Daten, die sie oder häufig die Daten, die sie da erheben, sind eben irgendwelche Beobachtungen und sind schlecht hinsichtlich kausale Zusammenhänge zu interpretieren. Was Sie hier beobachten können, sind schön gewisse Gleichzeitigkeiten.
42:20
Im Prinzip haben Sie irgendeinen Vorschlag, wie es zu dieser Gleichzeitigkeit kommt. Die hier eigentlich auftritt. Also warum haben denn die neuen Bundesländer eine viel höhere Wochenarbeitszeit als die alten Bundesländer?
42:58
Okay, zwei Vorschläge. Erstens eine andere eine andere Art von Industrie
43:01
hat sich angesiedelt, die eben eine höhere Arbeitszeit erfordert. Das wäre möglich. Und das zweite die politische Einstellung. Na ja, aufgrund der hohen Arbeitslosigkeit sind die Leute eben auch bereit, mehr zu arbeiten. Also im Prinzip haben sie eben also gerade diese hohe Arbeitslosigkeit macht führt eben auch dazu, dass die Gewerkschaften eher bereit sind, noch höhere Wochenarbeitszeiten
43:21
zu akzeptieren. Oder ich mein, Sie könnten anders sagen, die Leute haben damals noch so ineffizient produziert, dass sie eben eine höhere Arbeitszeit gebraucht haben, um überhaupt einigermaßen konkurrenzfähig zu sein, aber waren eben trotzdem nicht ganz konkurrenzfähig. Also könnten Sie es auch interpretieren.
43:44
Okay. Noch Fragen soweit? Fragen?
44:04
Wenn nicht, dann machen wir fünf Minuten Pause. Ich mische schnell die Tafel und um 10.40 Uhr machen wir weiter mit dem weiteren Begriff der sogenannten empirischen Korrelation. Okay, ich würde dann ganz, ganz soweit weitermachen. Sollten Sie sich nochmal an Ihre Plätze begeben.
44:40
Wir hatten jetzt gerade eingeführt die empirische Co-Varianz. Das war dieses S, X, Y gleich dem Zähler hier. Sie sehen sofort diese empirische Co-Varianz ist nicht maßstabsunabhängig, wenn Sie jetzt die Wochenarbeitszeit vielleicht statt den Stunden in Minuten angeben würden. Dann ist ganz klar,
45:02
würde sich um Faktor 60 alles ändern. Das X ändert sich um 60, X quer auch um 60. Den ganzen Faktor hätten Sie hier auch drin. Ich füge als nächstes eine maßstabsunabhängige Kurse ein und leite noch eine Aussage darüber her. Dazu gucke ich mir die Regressionsgrade nochmal genauer an. Die Regressionsgrade war dieses Y gleich A Dach.
45:21
Also unser S, X, Y durch S, X Quadrat hatten wir als A Dach abgekürzt. A Dach mal X minus X quer plus Y quer. Es ist klar, wenn ich dieses kleinste Quadratekriterium für die Regressionsgrade ausrechne, dann kommt da ein Wert größer gleich Null raus. Und das mache ich jetzt.
45:43
Ach so, ich wurde darauf hingewiesen, dass man es von hinten schlecht lesen kann. Ich werde mal gucken, dass ich ein bisschen größer schreibe. Aber sowas müssten Sie mir direkt sagen. Also Null kleiner gleich Summe I gleich 1 bis N.
46:15
Das ist klar, diese Summe der Quadrate ist größer gleich Null. Und das forme ich jetzt ein bisschen um.
46:25
Ich forme das um, indem ich das Y quer zu den Y I dazu ziehe. Also ich komme auf Y I minus Y quer,
46:41
dann minus A Dach mal X I minus X quer. Dann multiplizieren Sie das Quadrat aus, indem Sie und ich fasse separat das Y I minus Y quer als ein
47:01
Term auf das A Dach mal X I minus X quer als zweiten Term. Ich nehme die zweite binomische Formel. Ich bekomme das erste Quadrat minus zweimal gemischten Term plus zweites Quadrat. Ich ziehe die Summe gleich auseinander. Ich ziehe das A Dach gleich noch aus den Termen raus. Es sind Termen raus, dann kommen wir auf.
47:24
Habe ich eine Klammer vergessen ganz oben? Habe ich eine Klammer vergessen? Also ich habe hier eine Klammer auf Klammer zu. Wir machen es mal farbig.
47:46
Also ich glaube, ich habe keine vergessen, aber danke. Also ich quadriere den ganzen Term. Okay, also rechnen wir das mal aus.
48:02
Schreiben wir so mal die ersten Quadrate hin. Dann haben wir bei den gemischten Termen habe ich zweimal Y I minus Y quer mal A Dach mal X I minus X quer.
48:21
Das und zwar noch ein Minus. Das Minus zwei mal A Dach klammer ich gleich aus.
48:41
Und dann kommt noch das letzte Quadrat. Da haben wir ein A Dach Quadrat mal X I minus X quer zum Quadrat. Das A Dach Quadrat ziehe ich auch gleich wieder raus.
49:01
Und wir sind hier. Okay, und jetzt setzen wir für A Dach ein A Dach war S X Y durch S X Quadrat. Ich kann gleich noch ausnutzen, dass diese Summe der Quadrate
49:21
der X I minus X quer zum Quadrat hier gerade N minus eins mal S X Quadrat ist. Kann ich auch gleich einsetzen. Ich kann ausnutzen, dass diese Summe der gemischten Terme hier N minus eins mal S X Y ist. Setze ich ein und ich kann. Das da hier ist die bis auf den Faktor N minus eins die empirische
49:42
bis auf den Vorfaktor eins durch N minus eins die empirische Kurvvarianz der Y I. Da nehme ich die Abkürzung S Y zum Quadrat. Setze ich alles ein. Komme ich auf also das erste Quadrat ist N minus eins mal S Y zum Quadrat.
50:05
Dann minus zwei mal A Dach. A Dach war S X Y durch S X Quadrat. Dann die Summe ist N minus eins mal S X Y.
50:26
Dann kommt plus A Dach Quadrat. A Dach Quadrat ist S X Y Quadrat durch S X Quadrat S X hoch vier.
50:43
Und dann die Summe von der X I minus X quer ist wieder N minus eins mal S X Quadrat.
51:09
Ok, jetzt sind wir soweit. Dann sehen Sie der gemischte Term ist minus zwei mal N minus eins mal S X Y Quadrat durch S X Quadrat. Der hintere Term ist
51:20
N minus eins mal S X Y Quadrat durch S X Quadrat. Wenn Sie das hier kotzen. Das heißt der hintere Term stimmt bis auf den Vorfaktor zwei mit dem mittleren Term überein. Das heißt statt minus zwei N minus eins mal den Term haben Sie anschließend nur noch minus N minus eins mal den Term.
51:40
Und dann klammere ich noch dem Faktor N minus eins raus. Ich klamme auch gleich noch das S Y Quadrat raus. Dann komme ich auf N minus eins mal S Y Quadrat mal. Ja, dann bleibt hier noch eine eins stehen. Dann der Term mit dem Minus war eigentlich, nachdem Sie den
52:01
mit den letzten zusammengefasst haben, minus N minus eins mal S X Y Quadrat durch S X Quadrat und auch noch geteilt durch S Y Quadrat, weil ich habe ja das S Y Quadrat auch noch rausgezogen, was bei den Term gar nicht drin steht.
52:21
Das heißt, ich komme eigentlich auf minus S X Y durch S X mal S Y und das ganze quadriere ich noch.
52:52
Warum ich mit N minus eins und warum hier N minus eins steht?
53:04
Ja, also im Prinzip, Sie haben recht, ich könnte auch ganz am Anfang schon anfangen, eine eins durch N minus eins hinzuschreiben. An der Stelle. Aber es ist ja völlig egal, ob eins durch N minus eins größer gleich null mal diesen zweiten Term größer gleich null ist oder einfach der zweite Term, weil also N muss eben mindestens sollte
53:21
größer als eins sein. Aber es ist eigentlich klar, um eine Gerade anzupassen, sollten Sie mehr als einen Datenpunkt haben. Also N ist hier mindestens zwei. Und dann spielt es bezüglich dem Vorzeichen keine Rolle mehr, ob hier N minus eins steht als Faktor oder nicht. Aber Sie haben recht. Im Prinzip, ich hätte es auch gleich hier hinschreiben können. Nur hätte ich es dann eben
53:40
paar Mal abschreiben können. Und ja, dafür hätte sich hier raus gekunzt. Wäre aufs gleiche hinaus gekommen. Okay, okay. Sonst noch Fragen soweit.
54:08
Was ist mit dem Rest, was da in der mittleren Zeile steht? Der Rest, was der mittleren Zeile steht, wenn Sie ihn ausrechnen, stimmt bis auf den Faktor zwei mit den Termen hier überein. Und deswegen fliegt der Faktor zwei hier weg. Der taucht hier auch nicht mehr auf.
54:20
Es ist nur noch minus einmal. Und all die beiden Terme stimmen überein bis auf den Faktor zwei. Also es wird verrechnet mit dem, der zweite und dritte Term werden miteinander verrechnet. Okay, noch Fragen?
54:47
Ja, was bringt das Ganze? Ja, ganz einfach. Das Ganze bringt, wenn ich weiß, dass dieser Term größer gleich null ist. Und ich weiß jetzt, dieser Term ist immer größer gleich null als eine empirische Variante ist immer größer gleich null. N minus eins ist auch
55:01
größer gleich null, wenn N größer als zwei ist. Wenn jetzt diese beiden Terme ungleich null sind, also wir gehen mal davon aus, dass Sy nicht gerade gleich null ist, dann kann ich durch diese beiden Terme kurzen und dann sehen Sie, dann ist dieser Term größer gleich null. Damit dieser Term größer gleich null ist, muss das Quadrat hier kleiner gleich eins sein,
55:21
beziehungsweise der Term, der quadriert ist, muss im Intervall minus eins eins liegen. Also daraus folgt, ja, ich glaube, ich schreib's doch auf eine neue Tafel. Alles andere hat keinen großen Sinn.
55:41
Daraus folgt ein ein Term, den ich jetzt neu einführe und den bezeichne ich jetzt mit Rxy und das wird die sogenannte, werden wir als Korrelation bezeichnen, wird definiert als das, was da in der Klammer steht. Also empirische Kovariant Sy,
56:05
Sy mal durchgeteilt durch Sy mal Sy. Das liegt im Intervall minus eins eins. Gezeigt haben wir es eigentlich nur für den Spezialfall,
56:20
dass die empirische Kovariant von Y nicht Null ist. Was ist in, aber ich behaupte auch, dann ist es richtig. Was ist im Fall, dass die, dass dieses Sy gleich Null ist?
56:47
Das ist nicht definiert, weil man den Nenner mit Null hat. Haben Sie eine Ahnung, was man alles definieren kann? Also generell ist es schwierig, wenn Sie durch Null teilen. Machen Sie meistens nicht. Es gibt aber eine Ausnahme,
57:01
nämlich wenn Sie die Null selber durch Null teilen. Das können Sie definieren. Und wir definieren hier, dass Null durch Null gleich Null sein sollte. Also ich definiere Null durch Null sei eine Null.
57:23
jetzt die Frage, ist es, tritt denn der Fall auf? Wenn Sy gleich Null ist, ist dann Sy auch gleich Null. Überlegen Sie sich mal, also wenn die empirische Variant der Y-Koordinaten gleich Null ist, ist dann die empirische Kovariant auch gleich Null. Und wenn ja, warum?
57:49
Weil es dann keine Gerade durch die Punkte gibt, behaupten Sie. Ja, doch kann ich schon. Ich meine, also es ist so verteilt, dass ich keine Gerade machen kann. Doch können Sie machen.
58:01
Also dieser Fall, Sy² gleich Null würde zum Beispiel auftauchen, wenn alle Y-Koordinaten gleich Null werden. Dann würden alle Punkte auf der Y-Grade liegen. Dann können Sie einfach sagen, die Y-Grade, die X-Grade, die X-Grade selber ist die Regressionsgrade, ist auch die Gerade, wo alle Punkte drauf liegen. Also eine Gerade finden Sie. In Spezialfällen zumindest.
58:22
Nur die Frage ist, also meine Frage war eigentlich anders. Wenn das gleich Null ist, ist es dann klar, dass die empirische Kovariant auch gleich Null ist. Und wenn ja, warum?
59:02
Also Sie sagen, wenn es unten Null wird, wird es oben auch Null, weil da oben der gleiche Faktor auftaucht. Stimmt nicht ganz. Da oben tauchen ja einzelne X-I minus X-Quer auf. Oder die Y minus Y-Quer. Das heißt, wir müssten argumentieren, wenn zum Beispiel das hier gleich Null wird. Nehmen wir an, als X² wäre gleich Null. Dann müssten wir argumentieren, alle X-I minus X-Quer sind gleich Null.
59:22
Und ist das klar? Ja, wegen dem Quadrat. Wenn das hier gleich Null wird, dann müssen alle Semanten gleich Null sein, weil sie ja alle nicht negativ sind. Das heißt, dann sind alle X-I gleich X-Quer. Dann ist das hier auch. Dann wird das obere auch gleich Null.
59:41
Dann sind wir im Fall Null durch Null. Und genauso, wenn es S-Y gleich Null wird, dann ist das auch Null. Und dann stimmt diese Rechnung auch. Und Sie machen sich auch klar, diese Formel macht also auch Sinn. Also ich habe hier ganz gelockert durch das durchgeteilt. Diese Formel macht auch Sinn mit der Deutung Null durch Null gleich Null.
01:00:02
wenn das hier gleich Null ist. Also auch das ist dann die richtige Regressionsgrade. Ich habe es dummerweise schon weggewischt, man sieht es jetzt glaube ich nicht mehr. Aber man kann es sich relativ einfach klar machen. Okay, also was wir sehen, diese neu einzuführende Größe kommt gleich auf Folie.
01:00:21
Die empirische Co-Varianz liegt immer im Intervall von minus eins bis eins. Was wir weiter sehen ist, dass die empirische Co-Varianz das gleiche Vorzeichen hat, wie die Steigung der Regressionsgraden. Das liegt daran, weil die Steigung der Regressionsgraden, das war das hier,
01:00:42
und die empirische Co-Varianz unterscheiden sich nur durch einen positiven Faktor. Nämlich, wenn Sie das multiplizieren mit Sx durch Sy oder durch einen nicht negativen Faktor, kommt das hier raus und der Faktor ist nicht negativ. Das heißt, auch aus der empirischen Korrelation können Sie die,
01:01:01
oder aus dem Vorzeichen der empirischen Korrelation können Sie genauso die Steigung der Regressionsgraden ablesen. Das heißt, wenn die empirische Korrelation größer als Null ist, ist die Regressionsgraden steigend. Wenn die empirische Korrelation kleiner Null ist, ist die fallend. Also ein linearer Zusammenhang wäre steigend oder fallend.
01:01:24
Was Sie noch sehen ist, was passiert hier, wenn die beiden Extremfälle auftreten. Wenn die empirische Korrelation ist gleich plus eins oder minus eins.
01:01:43
Was Sie sehen könnten wäre, was passiert. Okay, sieht's jemand? Was passiert, wenn die empirische Korrelation plus eins oder minus eins ist?
01:02:02
Was können Sie dann über die Punkte aussagen? Die liegen alle auf derselben Gerade, richtig? Das sehen Sie daran, wenn die empirische Korrelation plus oder minus eins ist,
01:02:23
ist diese Klammer hier gleich Null. Dann ist der Gesamtausdruck gleich Null. Dann ist diese Summe der quadratischen Abwertstände gleich Null. Das heißt, die Datenpunkte liegen alle auf der Geraden. Umgekehrt können Sie sich überlegen, wenn die Geraden alle auf der Geraden liegen, können Sie dann eine Aussage über die empirische Korrelation machen.
01:02:42
Also ist das vielleicht eine genau dann wenn Beziehung? Sehen Sie das?
01:03:27
Vorschläge?
01:03:44
Okay, Vorschlag war, wenn das hier gleich Null ist, dann ist das gleich Null. Dann teilen Sie durch den Faktor durch. Dann muss der Faktor gleich Null sein und das ist gleich eins. Das wäre richtig, wenn der Faktor, der hier stehen würde, größer als Null wäre oder ungleich Null wäre. Bei den Teilen.
01:04:00
Aber was machen Sie, wenn die empirische Korvarianz der Y-Koordinaten gleich Null ist? Dann definieren Sie auch, okay. Und sagen Null durch Null ist Null, ne? Ja, okay. Wenn ich schon so einführe, ne?
01:04:21
Das war aber nicht eine Rechenregel für Umformungen, ne? Für Äquivalenzumformungen. Das war eine Notation. Also was eben auch auftreten kann, wenn die Punkte alle auf der Geraden liegen, dann ist dieser Ausdruck gleich Null, ist das gleich Null. Das kann aber sein, dann ist die empirische Korvarianz gleich Null.
01:04:44
Und dann haben wir vorhin auch gesehen, dann ist die empirische Korrelation aber auch gleich Null. Weil hier ist Zähler und Nenner gleich Null. Aber die empirische Korrelation ist nicht eins. Das heißt, es kann auch der Fall auftreten, dass die empirische Korvarianz der Y-Koordinaten gleich Null ist.
01:05:03
Und die Punkte liegen. Und dann liegen auch die Punkte alle auf einer Geraden. Aber die empirische Korrelation ist nicht eins. Was können Sie dann über die Gerade, über die Regressionsgrade aussagen?
01:05:22
Sie geht durch alle Punkte. Ja gut, es war so, ne? Sie muss durch alle Punkte gehen, ne? Das ist richtig, weil das war ja unsere Voraussetzung, dass dieses kleinste Quadratekriterium gleich Null ist.
01:05:43
Können Sie noch mehr über die Regressionsgrade aussagen? Oder über die Punkte?
01:06:09
Ja gut, wir waren bei dem Fall, die empirische Varianz von den Y-Koordinaten war gleich Null. Dann sehen Sie sofort, die Steigung der Regressionsgraden ist auch gleich Null.
01:06:21
Weil, wenn die empirische Varianz der Y-Koordinaten gleich Null ist, dann stimmen die YI alle mit den Y quer überein. Damit ist auch das Sxy gleich Null. Das heißt, sie geht durch alle Punkte, aber die Regressionsgrade läuft auch noch waagrecht. Das wäre der andere mögliche Fall noch, ne?
01:06:43
Okay, dann gehen wir mal zurück zu einem Folien, wenn Sie keine Fragen mehr haben.
01:07:05
Ja, und das ist dann der Punkt, wo mir wieder einfällt, dass mein Pointer gerade in Freiburg mit meinem Doktoranden ist. Und ich ihn wohl im Tiefschlaf am Mittwoch noch in die Hand gedrückt habe und gesagt habe, ich brauche ihn nicht mehr vor Mittwoch. Aber es war wohl ein kleiner Fehler.
01:07:21
Okay, gut, also wir waren hier eigentlich oder beziehungsweise das kam als nächstes, haben wir gerade mündlich schon besprochen. Man kann weiter zeigen, oder wir haben es gerade gezeigt, dass die sogenannte empirische Korrelation Rxy gleich Sxy durch Sx mal Sy im Intervall minus eins eins liegt. Die empirische Korrelation dient zur Beurteilung der Abhängigkeit der X- und der Y-Koordinaten.
01:07:43
Vorteil im Vergleich zur empirischen Kovarianz ist, wie gesagt schon, das Ding ist maßstabsinvariant. Oder zumindest jetzt sage ich es, einfach weil eine Veränderung vom Maßstab, zum Beispiel bei X, würde sich hier in diesen Faktoren auswirken. Aber hier genauso quadratisch, das heißt, die können es rausziehen aus der Wurzel und hätten den Faktor wieder genauso draußen.
01:08:03
Weil das Ding ist auch noch maßstabsinvariant. Und die empirische Korrelation macht Aussagen über die Regressionsgrade in die Lage der Punktwolke im Scatterplot. Ist die empirische Korrelation plus eins oder minus eins, so liegen die Punkte X, Y, I alle auf der Regressionsgrade. Ist die empirische Korrelation positiv beziehungsweise negativ, so ist auch die Steigung der Regressionsgrade positiv beziehungsweise negativ.
01:08:25
Und ist die empirische Korrelation Null, so verläuft die Regressionsgrade waagrecht. Hatten wir alle schon, oder das Null hatten wir eigentlich nicht, aber das war auch klar.
01:08:40
Ist die empirische Korrelation gleich Null, so muss das S, X, Y gleich Null sein. Und dann verläuft die grade waagrecht, weil dann ist auch die Steigung A Dach gleich Null. Okay, Fragen soweit.
01:09:09
Dann komme ich nochmal zurück zu Ihrer Anmerkung. Wir haben da ziemlich brutal eine grade reingeklopft. Kann man auch was anderes machen. In der Tat, man kann es auch anders machen. Ich erzähle noch kurz was zur nichtparametischen Regressionsschätzung.
01:09:20
Hier machen wir eine Verallgemeinerung der linearen Regressionen. Wir erfassen Funktionen allgemeinerer Bauart. Zum Beispiel Polynome an die Daten an. Das heißt, anstelle einer linearen Funktion könnte ich genauso gut ein quadratisches Polynom anpassen. Ableitung gleich Null setzen. Fertig. Sie werden es in Übungen mal mit einem kubischen Polynom machen und sich überlegen, wie das gleiche System dann aussieht.
01:09:43
Zum Beispiel wie bei linearen Regressionen durch Minimierung der Summe der quadratischen Fehler. Das ist das Prinzip der kleinsten Quadrate. Falls die Bauart vorgegeben ist und diese nur von endlich vielen Parametern, also unbekannten, realen Zahlen abhängt, wie beim Polynom, das wären es die Koeffizienten, spricht man von einer sogenannten parametischen Regressionsschätzung.
01:10:03
Falls die Bauart nicht vorgesehen ist, das wäre ein anderer Ansatz. Falls man keine Annahme an die Bauart der zu schätzenden, anzupassenden Funktion macht, spricht man von einer sogenannten nicht-parametischen Regressionsschätzung. Ich möchte Ihnen das einfachste Beispiel dazu, wie man sowas machen kann, kurz vorstellen.
01:10:23
Das ist die sogenannte lokale Mittellung. Der Wert des Schätzers an einer Stelle z ist das arithmetische Mittel der Y-Werte aller der Datenpunkte, bei denen der Abstand vom X-Wert zu z kleiner als eine vorgegebene Schranke ist. Was meine ich damit? Ich mache es am besten am Bild.
01:10:41
Da sehen Sie es relativ einfach. Sie haben hier die Datenpunkte. Seien wir diese Punkte. Sie haben hier die Stelle z. Ich möchte jetzt den Wert meines Schätzers an dieser Stelle bestimmen, mit der Idee von gerade eben arithmetisches, also Idee von Arithmeten war arithmetisches Mittel der Y-Werte aller der Datenpunkte,
01:11:05
bei denen der Abstand vom X-Wert zu z kleiner als eine vorgegebene Schranke ist. Das heißt als erstes, ich wähle mir eine vorgegebene Schranke, die ist hier eingezeichnet. Ich bin diese Schranke nach links gegangen, nach rechts gegangen und wähle alle diese Datenpunkte aus, die in dieser Schranke sind.
01:11:22
Das sind die jetzt Fett eingezeichneten Datenpunkte. Von diesen Datenpunkten betrachte ich die Y-Koordinaten und nehme das arithmetische Mittel. Das heißt von diesen zwei, vier, sechs Datenpunkten nehme ich die Y-Koordinaten, addiere sie auf, nehme das Bilde und teile durch sechs.
01:11:40
Kommen Sie als Funktionswert auf die Höhe dieser waagrechten Linie, die hier eingezeichnet sind. Und dann machen Sie an der Stelle z ihren Schätzwert als genau, nehmen Sie, machen Sie einen Punkt,
01:12:00
X-Koordinate ist z, Y-Koordinate ist genau diese Höhe, das wäre der Wert Ihres Regressionsschätzers an dieser Stelle z. Und das machen Sie jetzt nicht nur für diese Stelle, sondern das machen Sie für alle möglichen Stellen. Sie können sich vorstellen, Sie machen das eigentlich gar nicht mehr, weil das machen Sie nicht mehr von Hand. Aber das können Sie am Rechner machen, das programmieren Sie und rechnen dann die Funktion.
01:12:26
Also die Funktion haben Sie nicht mehr explizit gegeben, die können Sie nicht mehr schön hinschreiben, wie so eine Gerade wie vorhin. Aber Sie können die Funktionswerte vielleicht hier auf einem dichten Gitter ausrechnen, auf der X-Achse und das Ding dann anschließend plotten,
01:12:41
indem Sie die Punkte reinsetzen und vielleicht durch Geraden verbinden oder Geradenstücke verbinden. Wenn Sie es ein bisschen formaler hinschreiben können, macht es der sogenannte Kernschätzer. Der Kernschätzer können Sie hinschreiben als m von x, wer Funktionswert an der Stelle x, wer ein gewichtetes arithmetisches Mittel der Y-Werte, wobei die Gewichte, Gewichte sind hier das Ganze, hängen von den X-Werten allein ab.
01:13:09
Das heißt, ich schreibe das als Summe i gleich 1 bis n eine Funktion k von x minus xi durch h mal yi durch Summe j gleich 1 bis n k von x minus xj durch h. k von r nach r plus ist eine sogenannte Kernfunktion.
01:13:23
Eigenschaften wäre, k von 0 wäre größer als 0 und wenn Sie ein bisschen weggehen von 0, dann fällt das gegen 0 ab. Und h größer 0 die sogenannte Bandbreite. Wenn wir so machen wollen, wie da oben beschrieben, würden wir einen sogenannten naiven Kern nehmen. Das heißt, wir würden k nehmen als, ich mache es wie bei der Dichteschätzung,
01:13:43
ein halbmal Indikatorfunktion zum Intervall minus 1, 1, wer mein Kern. Das heißt, dieses Gewicht hier wäre entweder ein halb oder 0. Es wäre ein halb, wenn x minus xi durch h im Intervall von minus 1 bis 1 liegt.
01:14:00
Das haben Sie beim Kern-Dichteschätzer schon gesehen. Das heißt, dass der Betrag von x minus xi kleiner gleich h ist. Das heißt, für alle Datenpunkte, die bis auf h an der Stelle x, wo wir schätzen wollen, ranliegen, nehmen Sie Gewichten halb, für alle anderen gleich 0 und Sie wählen das arithmetische Mittel. Wenn Sie es ein bisschen glatter machen würden, würden Sie einen Kern nehmen,
01:14:24
der keine Unstädigkeitsstelle hat, sondern der vielleicht abfällt, aber insgesamt glatt ist, könnten Sie einen sogenannten Gauss-Kern nehmen, auch von der Dichteschätzung. 1 durch Wurzel 2 Pi mal e hoch minus u Quadrat halbe.
01:14:40
Okay, Fragen soweit? Das war so eine nicht-parametrische Reaktion im Schnelldurchgang. Was müssen Sie sich merken? Sie sollten sich merken, wir haben hier so eine parametrische Sache gemacht.
01:15:03
Wir haben die Bauart der Funktion, die wir anpassen, eigentlich vorgegeben. Das können Sie auch anders machen. Sie machen keine Annahme an die Bauart der Funktion. Das einfachste Beispiel wäre so eine lokale Mittelung. Da sollten Sie so eine Idee haben, was das hier ungefähr ist. Und dann gibt es eine Formel. Die Formel müssen Sie nicht auswendig wissen, aber die Formel sollten Sie wiedererkennen können, wenn Sie es irgendwie sehen
01:15:23
und vielleicht auch nachvollziehen können, was es so grob ist. Ich habe hier mal ein Beispiel mitgebracht. Zusammenhang zwischen Wochenarbeitszeit und Beschäftigungsquote in 26 europäischen Staaten im Jahr 2006. Also jetzt geht es um Beschäftigungsquoten, das Gegenteil von der Arbeitslosigkeit.
01:15:42
Das heißt, wie viel Prozent der Bevölkerung sind oder von der im Prinzip arbeitsfähigen Bevölkerung sind beschäftigt. Also ideal wäre hier 100 Prozent. Schlecht wären irgendwie 0 Prozent. Sie sehen, dass im Jahr 2006 Daten stammen von Eurostadt, der Statistikbehörde der Europäischen Union.
01:16:04
Es sind 26 Staaten. Sie sehen, das ist sehr verschieden. Manche Staaten, da geht es bis auf 80 ran. Bei manchen Staaten sind es nur knapp über 60 Prozent oder 55 Prozent. Können Sie sich erklären, wie der Unterschied zustande kommt?
01:16:21
Warbenarbeiten in manchen europäischen Staaten eher 80 Prozent der Bevölkerung, anderen eher 55. Das ist eine Sache der Mentalität. Ja, das ist richtig, hat irgendwas mit dem Land zu tun. Aber welcher Teil der Bevölkerung ist es, der in dem einen mehr arbeitet als in dem anderen?
01:16:49
Sie arbeiten im anderen Land und zählen nicht dazu. Also dann zählen Sie auch nicht zur Bevölkerung, wenn Sie im anderen Land arbeiten. Dann würden Sie im anderen Land auch leben. Es ist Frauen und Männer. Es geht einfach um, wie viel Prozent der Frauen sind beschäftigt.
01:17:04
Und wenn Sie da eben osteuropäische Länder gehen, da sind es eben sehr viele, wenn Sie westeuropäische Länder gehen. Oder Deutschland speziell, wären es eben deutlich weniger. Ich weiß jetzt nicht, wo Deutschland liegt. Hier drin müsste ich noch mal nachgucken. Aber wahrscheinlich irgendwo im Mittelfeld.
01:17:21
Okay, was sehen Sie jetzt hier? Wie verhält sich da die Beschäftigungsquote im Vergleich zur Wochenarbeitszeit?
01:17:50
Oder sehen Sie irgendwas?
01:18:09
In den Ländern, wo die Wochenarbeitszeit hoch ist, sind im Schnitt oder im Mittel weniger Leute, weniger Teil der Bevölkerung beschäftigt als in denen, wo die Wochenarbeitszeiten niedrig sind.
01:18:24
Wird wahrscheinlich auch der Unterschied sein zwischen Osteuropa und Westeuropa, wo Sie eben in Osteuropa noch mehr arbeiten und länger arbeiten. Und eben gleichzeitig auch... Nee, das kann jetzt nicht sein. Das wäre genau in die andere Richtung, wie ich es gerade zu interpretieren versuche.
01:18:44
Okay, wird wahrscheinlich der Unterschied sein zwischen den Ländern mit der hohen Arbeitslosigkeit, wo eben speziell auch weniger Frauen arbeiten. Ich denke vielleicht besser noch mal drüber nach oder mache hier keine Interpretation. Wir hätten jetzt auch brutal eine Gerade reinklopfen können.
01:19:02
Sie sehen, es hätte so ein bisschen ähnlich ausgesehen schon. Also Sie können sich irgendwie vorstellen, wie die Gerade verlaufen würde. Von links oben nach rechts unten, wäre klar. Aber Sie sehen, hier ist halt so ein Unterschied. Zum Teil hier flacht es jetzt wieder ab. Also bei der Geraden, das wäre beliebig angestiegen, hier flacht es wieder ab. Oder auch hier die Steigung flacht wieder ab.
01:19:24
Was Sie mir vielleicht auch beantworten können, wenn Sie... Typische Klausurfrage, die ich auch häufiger stelle, wenn Sie sich die Korrelation der Datenpunkte angeben. Ich gebe Ihnen den Scatterplot vor. Sind die Daten in diesem Scatterplot dann positiv korreliert oder negativ korreliert?
01:19:42
Also ist die Korrelation größer als Null oder kleiner als Null? Oder was genau können Sie über die Korrelation dieser Daten aussagen? Vorschlag?
01:20:07
Die Korrelation ist negativ, weil eine Regressionsgrade eben von links oben nach rechts unten laufen würde. Und eine negative Steigung hätte. Könnte die Korrelation gleich minus eins sein?
01:20:26
Also ich habe schon ein paar Mal nein gehört, Begründung. Die Punkte liegen nicht alle auf einer Geraden. Da müssten die Punkte alle auf einer Geraden liegen. Okay, vielleicht noch letzte Folie. Wie beim Kerndichtestschätzer bestimmt auch hier die Bandbreite, die Glattheit bzw. Rauchheit der Schätzung.
01:20:44
Das heißt, wenn Sie eine sehr kleine Bandbreite wählen, dann bekommen Sie eine stark schwankende Schätzung. Wenn Sie eine sehr große Bandbreite wählen, dann würden Sie mehr oder weniger einfach nur den Mittelwert aller Y-Koordinaten betrachten. Verläuft das Ding mehr oder weniger konstant. Okay, damit wäre ich für heute fertig. Diesmal zwei Minuten vorher.
01:21:05
Und wir sehen uns am Mittwoch.