Woche 4 : Wie war das nochmal?
This is a modal window.
The media could not be loaded, either because the server or network failed or because the format is not supported.
Formal Metadata
Title |
| |
Subtitle |
| |
Title of Series | ||
Number of Parts | 79 | |
Author | 0000-0002-8080-349X (ORCID) | |
License | CC Attribution 4.0 International: You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor. | |
Identifiers | 10.5446/65523 (DOI) | |
Publisher | ||
Release Date | ||
Language | ||
Production Year | 2023 | |
Production Place | Heinrich-Heine-Universität Düsseldorf |
Content Metadata
Subject Area | ||
Genre | ||
Abstract |
| |
Keywords |
12
17
18
34
36
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
56
58
59
61
63
66
67
68
69
71
74
75
78
79
00:00
IBMPredictionAgent <Informatik>Mathematical structureAlgorithmRun-time systemScientific modellingKennzahlAverageFilm editingZusammenhang <Mathematik>Structural equation modelingMedianStatisticsStatistikerSeries (mathematics)Module (mathematics)Function (mathematics)Machine learningReinforcement learningComputer programmingArtificial neural networkArtificial intelligenceMatrix (mathematics)Module (mathematics)Row (database)Data structureIndexListe <Informatik>JSONXMLComputer animation
07:20
Machine learningZugriffFocus (optics)Computer animationXML
Transcript: German(auto-generated)
00:09
In Europa ziehen junge Erwachsene durchschnittlich mit 26,5 Jahren aus dem Elternhaus aus. In Deutschland im Schnitt hingegen schon mit 23,6 Jahren. Im Prüfungsjahr 2020 lag die
00:22
mittlere Fachstudiendauer für einen Bachelorabschluss, hier anhand des Medians und ohne den Lehramtsbachelor, bei 7,2 Semestern für Erstabsolventinnen und Erstabsolventen. Statistische Angaben wie diese begegnen uns sehr häufig im Alltag. Es gibt Statistiken zu so gut wie allen und daran wird ein Stück weit deutlich, Statistik ist ein wichtiges Werkzeug, das uns dabei hilft,
00:43
die Welt zu beschreiben, große Datenmengen zu strukturieren und neues Wissen daraus zu generieren. Daher ist es jetzt auch keine Überraschung, dass Statistik und auch statistische Konzepte auch für künstliche Intelligenz und für maschinelles Lernen wichtig sind. Doch halt. Da war es wieder. Maschinelles Lernen. Einer der Begriffe,
01:01
den man im Zusammenhang mit künstlicher Intelligenz so oft hört. In der letzten Woche hast du eine ganze Reihe von Begriffen kennengelernt, die einem häufig begegnen, wenn man sich mit künstlicher Intelligenz beschäftigt. Da diese Begriffe auch für den weiteren Kurs sehr wichtig sind, werfen wir nochmal kurz einen Blick darauf. In der letzten
01:24
Woche hast du maschinelles Lernen als Teilgebiet der künstlichen Intelligenz kennengelernt. Dieser Begriff ist besonders wichtig, da wir uns in diesem Kurs hauptsächlich auf maschinelles Lernen konzentrieren. Maschinelles Lernen bedeutet, ganz grob gesagt, Lernen aus Daten. Es handelt sich um einen Prozess, bei dem
01:41
beispielsweise ein Computer oder ein System selbstständig aus Daten lernt, ohne dass ein Mensch diesen Prozess Schritt für Schritt begleiten oder anleiten muss. Durch dieses Lernen verbessert der Computer dann eine Leistung oder präzisiert Vorhersagen. Methodisch betrachtet lässt sich maschinelles Lernen in insgesamt drei Kategorien einteilen. Bei der ersten Kategorie, dem supervised learning, also dem überwachten Lernen,
02:04
gibt der Mensch vor, was gelernt werden soll, indem er Trainingsdaten mit festen Labeln zur Verfügung stellt. Anhand dieser Trainingsdaten lernt dann die Maschine, um später Vorhersagen treffen zu können. Bei der zweiten Kategorie, dem unsupervised learning, also dem unüberwachten Lernen, wird im Vorfeld nicht vorgegeben, was gelernt
02:23
werden soll. Die Maschine oder das System soll dann entsprechend selbstständig Zusammenhänge und Strukturen in den Daten finden. Und dann wäre da noch das reinforcement learning, also das verstärkende Lernen als dritte Kategorie, bei dem ein sogenannter Agent oder auch eine sogenannte Agentin mit der Umgebung interagiert, um eine Belohnung zu maximieren.
02:44
Aber halt! Es gibt auch noch deep learning. Wie passt das denn jetzt da rein? Deep learning oder auch tiefes Lernen ist ein Teilgebiet von maschinellem Lernen. Für Deep learning ist es ein Teilgebiet, in dem man in der Maschinellehrung, wo man die Maschinellehrung verwendet, große Datenmengen benötigt und die
03:01
verwendeten Algorithmen sind vom menschlichen Gehirn und von seinen Neuronen inspiriert. Das spiegelt sich auch in den Modellen wieder, die typischerweise für deep learning verwendet werden, den neuronalen Netzen. Hier werden mehrere Verarbeitungsebenen verwendet, um schrittweise immer detailliertere Merkmale aus Daten zu extrahieren. Mit Deep learning als Teilgebiet des maschinellen Lernens lassen sich ebenfalls supervised learning,
03:25
unsupervised learning und reinforcement learning realisieren und zwar mit Hilfe neuronaler Netze. Deep learning, maschinellem Lernen und der künstlichen Intelligenz als Überbegriff ist gemein, dass statistische Konzepte ein grundlegender Bestandteil für ihre Methoden sind. In der letzten Woche hast du viel über Trainingsdaten gelernt. Du weißt,
03:49
dass man sie sich vorher sorgfältig anschauen sollte und dass man sich sorgfältig überlegen sollte, welche Daten und Angaben oder auch Features man für die Aufgabe, für die das System trainiert werden soll, benötigt. Du erinnerst dich vielleicht noch an das Beispiel
04:02
mit dem Fahren. Die Passung zwischen Daten und Aufgabe sowie die Qualität der Daten ist wichtig für die Genauigkeit des Modells. Wenn man mit Müll trainiert, kommt nämlich auch Müll raus. Oder im schlimmsten Fall eben diskriminierende Entscheidungen, wie bei dem Amazon Beispiel aus der vergangenen Woche, bei dem Frauen im Bewerbungsprozess auf grund von verzerrten Trainingsdaten benachteiligt wurden. Um Systeme, die auf künstlicher
04:26
Intelligenz basieren, gute Trainingsdaten zur Verfügung zu stellen, müssen diese Daten sorgfältig geprüft und auch vorverarbeitet werden. Und hier können uns statistische Kennzahlen und Konzepte helfen, indem sie uns dabei unterstützen die Trainingsdaten zu verstehen, aufzubereiten, zu visualisieren und auch zu interpretieren. Und daher lernst
04:45
du in dieser Woche einige wichtige statistische Konzepte und Kennzahlen, wie beispielsweise Matrizen, den Medien oder auch ein Mittelwert kennen. Und wir zeigen dir ein paar Fallstricke, auf die man bei der praktischen Anwendung dieser Konzepte und Kennzahlen achten sollte. Denn es ist wichtig zu wissen, welche statistischen Kennzahlen man für
05:03
seine Daten sinnvoll einsetzen kann. Und dafür sollte man sich seiner Daten bewusst sein. Nicht, dass man am Ende einen Gorilla übersieht. Was der Gorilla damit zu tun hat, das erfährst du selbstverständlich auch in dieser Woche. Aber wir zeigen dir natürlich auch, um nochmal zurück zum Thema zu kommen, wie du dir beispielsweise
05:21
einen Mittelwert eines Datensatzes mit Python ausgeben lassen kannst. Dafür benötigt Python sogenannte Module. Module sind im Prinzip eine Art Werkzeugkasten mit verschiedenen Hilfsmitteln, die bereits programmiert wurden. Wir stellen dir diese Woche zwei solcher Module vor. Nämlich das Modul Scientific Python oder SciPy und
05:40
Numerical Python, NumPy. Das Modul NumPy enthält auch eine neue Datenstruktur, nämlich NumPy Array. Diese Datenstruktur ähnelt den verschachtelten Listen, die du bereits kennst. Und auch NumPy Array wollen wir dir diese Woche näher zeigen. Du lernst, wie man sie erzeugt und auch, wie man auf einzelne Elemente eines Arrays zugreifen oder dieses ändern kann. Und dafür brauchst du das Wissen zu Listen
06:04
Besonders wichtig die Indizes, denn damit kannst du Elemente einer Liste oder eben auch eines Arrays ansprechen. Denk dran, geht man beispielsweise eine Liste von links nach rechts durch, hat das erste Element den Index 0, das nächste Element den Index 1 und so weiter. Geht man die Liste dann von rechts nach
06:22
links durch, hat das erste Element den Index minus 1, das nächste den Index minus 2 und so weiter. In dieser Woche lernst du also einige statistische Konzepte und Kennzahlen, wie Mittelwerte und Matrizen kennen. Und wir zeigen dir anhand von SciPy und NumPy Module und Funktionen in
06:42
Python. Mit diesen Modulen kannst du dann unter anderem auch die statistischen Kennzahlen, die du in dieser Woche kennenlernst, mit Python ermitteln. Im Bereich der Ethik wird es dann in dieser Woche um Nachhaltigkeit gehen. Du erfährst, wie KI-Systeme Nachhaltigkeit unterstützen können, beispielsweise bei der Optimierung von Energieverbrauch. Aber wir wollen auch über die Nachhaltigkeit von KI-
07:03
selbst sprechen. Und abschließend zeigen wir dir dann noch ein paar Beispiele, worauf man bei der praktischen Anwendung von statistischen Kennzahlen und Konzepten achten sollte und warum es wichtig ist, seine Daten zu kennen. Nun aber viel Spaß in dieser Woche und schau noch mal, ob du den Gorillab findest.