Bestand wählen
Merken

Vergangenheit und Zukunft künstlicher Intelligenz

Zitierlink des Filmsegments
Embed Code

Automatisierte Medienanalyse

Beta
Erkannte Entitäten
Sprachtranskript
es geht um mehr künstliche Intelligenz ich habe den Weg in die Kassen sein sagte der Schiffe Bildverarbeitung und künstliche Intelligenz nicht im Wege hier nicht allzu viel darauf eingehen wie man jetzt
Intelligenz genau definiert eigentlich und was genau sich dahinter verbirgt ich glaube das wird aber im Laufe des Vortrags ein bisschen klarer insbesondere ist der Begriff Intelligenz glaube ich ein etwas fließender dessen Definition sich über die Zeit auch gewandelt hat dass wenn auch im Vortrag ein bisschen ziehen Jahr spielen Themen wie Bildverarbeitung und künstliche Intelligenz eine Rolle einen dem ganz zentrales Thema an dem wir seit einigen Jahren arbeiten ist das Thema der Fahrerassistenz hier sehen Sie Sonne comma hoffe sie können das sehen Sie fahren die Straße runter da sind Kameras heutzutage in den Autos installiert damals als wir anfingen vor über 10 Jahren Sie sind schon mit welcher Firma mit Daimler da war nur eine Kamera im Auto und ich habe immer wieder gesagt kann man nicht eine zweite Kamera einbauen da hieß es das ist zu teuer seine L mit Kamera koste ungefähr 10 Euro das Auto kostet ungefähr 50 Tausend Euro wenn wie war das 10 Euro zu viel die Kinder der und der Punkt ist ein bisschen damals hat man ganz offensichtlich noch nicht so es bisher nicht eingegangen genau ich hoffe Sie sehen immer noch tief genau ja das ist was man daran erkennt ist eben dass er in der Sinn von Kameras vor 10 Jahren auch im Management bei Daimler noch nicht so richtig klar war was mich ein bisschen überrascht hat weil
ich ich bin selber seit ungefähr 20 Jahren in dem Bereich tätig und für mich ist vom ersten Tag an offensichtlich was die Möglichkeiten und Chancen dieser kamerabasierten der Erfassung der Welt sind und das ist auch ein bisschen das Thema was mich vorantreibt dann lasse ich ihn halt auch ein bisschen vermitteln will was man nämlich machen kann ist wenn man zum Beispiel 2 Kameras hat haben irgendwann
2 Kameras gekriegt nicht etwa weil ich jetzt da insistiert hatten eine sondern weil er eines Tages Toyota mit 2 Kameras rauskam musste also bei wir sofort auch der zweite Kamera und mit 2 Kameras kann man dann die Welt rekonstruieren in 3 und auch die Bewegung der Strukturen erfassen so wie Sie es hier sehen man kann erkennen dass der Objekte sind man kann hier farbkodierte sehen dass ein Objekt bewegt sich das andere nicht und Bewegung heißt wirklich also auch Informationen wo sich die Strukturen hin bewegen und solche Bewegungsinformationen ist zentral wichtig um voraussagen zu machen und das können sich vorstellen wenn es darum geht Hindernisse zu erkennen und Unfälle zu vermeiden genau wie wenn
sie im Straßenverkehr fahren als Autofahrer je weiter sie die Zukunft vorhersagen können was passiert als nächstes desto sicherer können Sie fahren desto eher können Sie Gefahren vorhersehen und sagen mit dieser Geschwindigkeit wird dieser Fußgänger in den nächsten 3 Sekunden in meinem Frage sein also muss sich ein Bremsmanöver einleiten und und dann ist sie galt L typischerweise damals hieß der sinnlich das unter dem Schlagwort Fahrerassistenz heute liest man sehr viel mehr auch über das Thema selbstfahrende Autos und das ist auch ein Thema an dem wir sehr viel forschen wir dich auch später noch mehr drauf eingehen wie er das ist der Lehrstuhl für Bildverarbeitung und Künstliche Intelligenz an der TU-München Milizen in der Informatik sind aber eng verbandelt auch mit der Mathematik im selben Gebäude das heißt auch unsere Mitarbeiter rekrutieren wir aus aus dem Markt aus der Informatik aus der Physik aus der E-Technik sehr viel verschiedenen Wissenschaftsbereichen was für uns wichtig ist ist in der Tat diese interdisziplinäre Hintergrund Leute zusammenzubringen mit unterschiedlicher Expertise Leute in diene Kamera installieren können Leute aber auch dieser mathematische Algorithmen der herrschenden um sozusagen die Daten aus der Kamera zu bearbeiten und mit so vielen Leuten das sind um die 25 Doktoranden aktuelle und mehrere Postdocs arbeiten wir zwangsläufig an vielen verschiedenen Themen und ist ein bisschen schwer jetzt das alles zu gruppieren ich verliere selber manchmal den Überblick an welchen gehen der arbeiten oftmals kommen Leute und sagen hat man fast schon zu dem Thema weil was gemacht dann sage ich oft ne und dann fällt mir nach doch Moment war also es ist einfach eine große Gruppe mit vielen Aktivitäten ich will hier das sind ein paar exemplarische wir arbeiten an einem autonomen Robotern insbesondere zum Beispiel fliegenden Roboter an die Arbeiten an der mathematischen Optimierungs- fragen das ist eigentlich meine eigene Hintergrund methodische Optimierung der noch speziell konvexe nicht konvex Optimierung ein Thema an dem wir auch viel arbeiten sind Maschinen Lernverfahren und insbesondere sogenannte neuronale Netze ich bin sicher manche von ihnen haben davon gehört heute würde ich auch ein bisschen darauf zu sprechen kommen und ein Thema an dem er sehr viel arbeiten ist die Rekonstruktion der dreidimensionalen Welt Ausbildern auch ein Thema über das ich heute ein bisschen mehr erzählen möchte hier also zum Beispiel einfach nur aus der Forschung künstliche Intelligenz ist sehr eng verbandelt mit dem Thema Maschinen an den was genau der Unterschied ist möchte ich wie gesagt nicht heut nicht zu viel über Terminologien jetzt diskutieren weil da kann man 8 Halt verlieren was ist eigentlich schön künstliche Intelligenz vielleicht aber doch ein bisschen ein paar Worte dazu zum Beispiel traditionelle hat man Intelligenz verbunden mit so Sachen wie Schach nicht und jemand der intelligentes wird also ein bisschen was immer der gut Schach spielen kann hätte man früher gesagt ist ein Zeichen von Intelligenz ob das heute noch gilt kann man sich fragen was ist nämlich passiert man hat versucht also solche Fähigkeiten von intelligentem handeln oder denken oder so irgendwie maschinell zu reproduzieren und das ist eben dieses Thema Künstliche Intelligenz gibt sehr frühe Versuche das ist eine ganz interessante Arbeit von Wolfgang von Kempelen ein System was der konzipiert hat und was er Schachtürke genannt hat zumindest ist das unter dem Begriff bekanntgeworden 1770 schon das ist ein Apparat sehen dass hier ein bisschen in dieser der Lithographie da ist drinnen ein kleines Männlein ein kleiner Mensch also wie es möglichst nicht zu groß da hat sich da drin versteckt nach außen hin ist es aber zu mit dem Effekt dass die Außenstehenden zu zeigen so geregelt kriegen dass das eine Maschine ist kein Mensch damals waren die Maschinen können sich denken auch nicht so leistungsfähig dass sie wirklich Schach spielen konnten aber der Erfinder hat sozusagen suggerieren wollen hier ist ein Gerät das Grand Schachspiel Maschinen und dann hat man verschiedene Türen gehabt und die haben so machen geöffnet dass der Mensch der da drin war jedes Mal wenn ich gerade woanders versteckt hatte mit dem Effekt dass die Zuschauer in der Tat viele über lange Jahre wohl der Meinung waren dass da keinen Stress ist und dass das ein gerechtes damit ist das Verfahren berühmt geworden daher stammt übrigens auch der Begriff gibt wird das kommt von diesem Apparat weil nämlich eben doch ein Mensch trennen war und keine Maschine und der hat sozusagen die Schachzüge macht typischerweise ein sehr gut Schachspieler und auch Leute wie Napoleon und so sind gegen diese Maschine angetreten und haben chronisch verloren ja ja und das waren also die Anfänge da war es noch keinen wirklichen Maschine sondern nur so geriert aber sie sehen schon der Traum war irgendwann mal ein Gerät zu haben was das kann und Sie wissen sicherlich dass ist schon in den fünfziger Jahren hat man angefangen wirkliche Schachcomputer zu entwickeln Maschinen die Schach spielen können und eine sozusagen der Hai Leids in einer langen jahrzehntelangen Geschichte ist ein System von IBM Blue ließ das 96 und dieses Verfahren hat dann in die Weltmeister im Schachtisch das hat viele Jahre und Jahrzehnte gedauert bis es so weit aber ich muss aber sagen ich habe angefangen mit Computern noch als Schüler der Commodore 64 war Heimcomputer denn ich bin bin so die erste Generation die der voll erwischt wurde von dem Gerät hat mich auch bis heute sehr viel geprägt diese Zeit schon mit 14 zu sehen was Maschinen kann und das
war aus heutiger Sicht sehr einfach Computer aber ich erinnere noch da hatte ich irgendein Schachprogramm ich weiß nicht welches aber das hat immer gewonnen das hat immer gewonnen ich bin jetzt auch kein Schachgroßmeister insofern aber schon in den achtziger Jahren habe ich gesehen zumindest zum mittelmäßige Spieler konnten von Maschinen geschlagen es hat dann aber bis Ende der neunziger oder Mitte der Neunziger gedauert dass auch wirklich die Weltmeister im Schach von Maschinen geschlagen werden aus heutiger Sicht kann man sagen ist es nicht wirklich verwunderlich für mich war es nie sonderlich verwunderlich war ich auch als Teenager schon das erlebt hat man von der Maschine geschlagen wird woran liegt es zum Beispiel hier dieses System hat 96 pro Sekunde 126 Millionen Bestellungen evaluiert das heißt man kann einfach gucken was würde passieren wenn ich die Figur der die Figur es wird einfach alles naiv durchgerechnet dass es ein bisschen vereinfacht man hat auch damals schon Heuristiken angewendet und zu entscheiden welche Schritte sind völlig blöd die braucht man gar nicht weiter zu verfolgen aber sie können sich vorstellen dass Schach spielen kann man so als einen Entscheidungsbaum aufziehen in jedem Punkt habe ich mehrere Möglichkeiten wenn nicht die Macht habe ich von da wieder hat der Gegenspieler mehrere Möglichkeiten man guckt halten wir wie viele Schritte kann ich in die Zukunft vorhersagen was wären denkbar erzielt da muss ich immer gucken dass der für mich blitzte zu gehen möglichst beste allen Situationen noch bringen und die entsprechende Züge so machen und in das heißt das Schachspiel ist in großem Stil berechenbar und rechnen können Maschinen mit dem Effekt dass in der Folge dann plötzlich zumindest habe ich oft so wahrgenommen in der Öffentlichkeit so ein bisschen in die Meinung aufkam das Schachspielen doch nicht wirklich was mit Intelligenz zu tun hat wenn es seine Maschine kann dann kann es nicht so intelligent sein mit dem Effekt dass der Begriff Intelligenz zumindest so wie ich ihn in der Öffentlichkeit an denen immer wieder sich wandelt und zwar abhängig davon was können Maschinen und was können sie nicht das war also die Blut das Schachspielen war dann gegessen das ist über Jahre noch weiter gegangen aber inzwischen ist ein Konsens dass Maschinen besser Schach spielen als Mensch man hat sich dann konzentriert die Community Schach Schach so zeigen Computer Community hat sich dann fokussiert auf Buch spielen warum Co spielen weil man bei Co ein sehr viel größerer stellt hat mit sehr viel mehr sozusagen Möglichkeiten und den Effekt dass man nicht mehr so leicht vorausberechnen kann alle denkbaren ziehen es gibt einfach jeden Schritt sehr viel mehr Möglichkeiten und damit die reichen x 126 Millionen ob Evaluierung pro Sekunde reichen beileibe nicht unvernünftig zu spielen das heißt auch in den Neunzigern haben entsprechende Strategien bei grob nur funktioniert um auf ganz kleinen Feldern ganz schlechte Spieler zu schlagen also hat man angefangen das irgendwie intelligenter anzugehen trotzdem auch da gab es den Durchbruch aber sie sehen schon das sind doch immerhin 20 Jahre dazwischen Herr AlphaGo 2016 also vor 2 Jahren hat den Weltmeister oder einen der besten Spieler in Group geschlagen und das hier einfließt ist eine Mischung aus einmal Berechnung von vielen denkbaren Stellungen aber auch Heuristiken die man versucht zu lernen insbesondere mit sogenannten neuronalen Netzen und das war einer der Durchbrüche der neuronalen Netze der hier er hat zu sehr viel Öffentlichkeitsinteresse geführt am Thema Künstliche Intelligenz am Thema neuronale Netze für mich muss ich sagen es sind aber diese Sachen nicht das was wirklich beeindruckend ist und was wirklich die Herausforderung ist auch was auf machen wir uns als Menschen gar nicht klar was unser Gehirn an Leistung bringt ich sach immer das menschliche Gehirn ist nicht entwickelt worden für Schach spielen oder Go-Spiel über Jahrtausende von Evolution ist das nicht das wofür wir optimiert sind von der Natur das Thema wofür wir wirklich optimiert sind ist die Bildverarbeitung das Verstehen der Welt Ausbildern hier zum Beispiel neulich in der letztes Jahr war das glaube ich habe dich in Abendvortrag im Deutschen Museum und da kann ich etwas früher schon dahin um ein Computer aufzubauen und so und da war der Museumsshop noch war schon zu aber beleuchten noch ich Kokereien und da sehe ich ein und der Punkt ist das das finde ich immer wieder faszinierend vielleicht weil ich an dem Thema arbeitet Menschen können sowas in Nullkommanix wir einsteigen und was ist die Herausforderung ist es eine super komplexe Szenen mit vielen verschiedenen haben visuellen Informationen nicht nur zu erkennen dass ist ein Mensch das ist sein Gesicht das ist ein älterer Herr der erkennt sofort wer das ist unter wie viel die sich dann würden Sie erkennen Tausend trotzdem ganz schnell auch wenn das nicht anders ist auch wenn die Haare anders sind auch wenn wir dieses spezielle Ansicht von Einstein möglicherweise noch nicht gesehen hätten diese glaube ich haben wir schon tausendmal gesehen aber trotzdem können wir doch alle Menschen sehr schnell erkennen und das ist finde ich sehr viel faszinierender und aus meiner Sicht sehr viel schwieriger warum weil im Gegensatz zu Schach oder Go hier gar nicht klar ist was muss ich eigentlich machen um eine Maschine das näher zu bringen ich fühle sie immer veranschaulichen nehmen wir den Einstand und die Art wie solche Bilder im Computer gespeichert sind ist das denn das würde ich suche mir immer anderen kleinen Ausschnitt das sieht so aus wie
sie in der lauter helle und dunkle Pixel die Steuerelemente so wie sie im digitalen Bild das gespeichert haben und die kann man jetzt alle mit Zahlen kodieren so ist das auch im Computer realisiert oder in der Kamera dunkler nämlich erniedrige Zahlen zum Beispiel 27 und helle Farben zum Beispiel diesen Punkt in anderen Ecke der hat dann er 198 sie haben uns das Gala und hell heißt größere Zahl als heller kleinere Zahl heißt dunkler und diese und Mini kleiner Ausschnitt das sind diese Zahlen hier das gesamte Foto das wir eine Riesen Matrix Panzer sehr viel größer war als dieser kleine aus stellen sich vor ich würde Ihnen jetzt genau dieser Matrix von Zahlen in Klammern und sie fragen was sehen Sie ist ja entstanden als Siedler handeln wiesen sie würden sagen Moment das ist ja nicht das was ich sehe ist richtig aber die Information die in diesen Zahlen steckt ist exakt dieselbe exakt denn ich habe genau dieses Männlichkeitsbild genommen nur in so dargelegt wie es im Computer gespeichert ist und schon kann der Mensch damit überhaupt nichts mehr insbesondere wenn ich jetzt die Beleuchtung der Szene ändern würde auch nur ganz bisher würden sich alle Zahlen ändern als sie können also auch nicht darauf sich verlassen sich die Zahl auswendig zu merken die für ein Stein stehen und dann im gegebenen Fall zu kucken Sie ist dass dieser bezahlen Matrix oder nicht neidisch durch Helligkeitsänderung durch Beleuchtungs- Änderung ändert sich einfach alles und wie kriege ich ja zu Hause zuverlässig dass das dieselbe Person ist das da ein Gesicht codiert ist dass das menschliche das ist eben nicht ganz einfach das ist eines der Probleme mit denen wir im Bereich Bildverarbeitung kämpfen nur eines von vielen aber 1 was in der Öffentlichkeit immer wieder gerngesehen ist und dass es kulminiert in einer Herausforderung die Kollegen von mir Freunden und Kollegen ins wird für die die hat mit ihren Mitarbeitern einen Datensatz ins Netz gestellt der heißt im das ist ein Datensatz der hat aktuell etwas mehr als 14 Millionen Bilder gesteinigt und zu diesen Bildern nicht zu allen aber zu etwa einer Million von den Bildern gibt es eine Information was in dem Bild drin ist zum Beispiel wenn Sie den Suchbegriff Dalmatiner per eingeben kriegen sie lauter Bilder von Dalmatien und muss ein bisschen aufpassen weil es gibt auch Pflanzen die den Begriff Dalmatiner drin es gibt sehr viele verschiedene Objektklassen die irgendwie mit dem Begriff Dalmatiner verbunden sind nicht nur Hunde witziger und die Herausforderung die sozusagen wegen an die Welt gestellt hat ist könnt ihr diese Bilder automatisch klassifizieren das automatisch erkannte bei irgendeinem wird nicht nur das eine Katzen Hunden Auto sondern auch ein Dalmatiner oder hier noch eine andere Klasse kennen Sie was das ist heute verschiedene Bilder die sie sehen schon farblich hoch unterschiedlich aus mal sind sie grün mal sind anders das sind alles für sie alles manche Menschen wissen gar nicht was ich alles ist es führt dazu dass auch Menschen bei dieser Herausforderung nicht die perfekte Lösung ringen denn es sind Millionen Bilder und das sind Tausende von Objekt das die man unterscheiden kann das war die Herausforderung richtig die Computer wischen Community hat über Jahrzehnte an diesem Thema gearbeitet also haben die alle ihre Leistung das aufgeknallt die bestmögliche Verfahren die besten Technologien drauf geworfen und dann haben die sozusagen auf dieser Fehler Gala ein Fehler von 26 gehabt hat gesagt es vereinfacht gesprochen der Computer macht auch einer bestimmten Anzahl von Bilder der evaluieren soll 26 Fehler Boards 8. da ist ne Katze im Bild ist ist aber gar keine Katze der Mensch macht auf denselben Datensatz nur 5 Fälle also kann man sagen die Maschine macht mehr als fünfmal so viele Fehler wie der Mensch auf dieser Herausforderung und das war ein bisschen ernüchternd für die X Community weil die Performance stagniert ist man ist einfach nicht mehr an die menschliche Leistung angekommen und das war die große Herausforderung wie kann ich dieses Verb reduzieren diese Differenz zwischen dem was Menschen können und dem er was Computer können und das ist eben ein wirklich sehr viel schwierigeres Problem als Schachspiel nein es etwas sehr Überraschendes passiert für die ganze Fachwelt überraschend 2012 hat Alex Kerry Schewski und seine Co-Autoren eine Arbeit rausgebracht die auf denselben Datensatz plötzlich nur noch 16 comma decimal 4 Fehler gemacht sehr viel weniger was hat er gemacht das war sozusagen die Wiedergeburt neuronale Netze neuronalen Netz ist ein Konzept was schon die ewig zurückgeht also Sigmund-Freud Freud hat schon sich Gedanken gemacht über wie das Gehirn arbeitet wie die Neuronen miteinander kommunizieren und schon in den achtziger Jahren hat man künstliche neuronale Netze im Computer simuliert in den neunziger Jahren ich weiß noch ich wollte damals Doktorarbeit machen zum Thema neuronale Netze kam aus der Physik dachte jetzt wo ich mal was letztlich machen in meiner Doktorarbeit ich habe zum Beispiel den Kohle-Chef Autoren dieser Arbeit der als Job hinten den habe ich damals an Gemälden gefragt wie sieht's aus hätten Sie noch Platz für ein Doktorand und ich würde gern bei Ihnen Doktor Arbeit macht die Leute haben damals alle nicht reagiert und viele haben mir gesagt junger Mann sie scheinen so talentiert machen Sie doch was Vernünftiges neuronale Netze sind tot da war ich etwas ernüchtert und dachte warum sind jetzt tot die haben leider eben nicht so gut funktioniert wie man das erhofft hatte und man hat sie dann also sozusagen ins in die Besenkammer gestellt sich anderen Formalismen zugewandt andere Methoden zugewandt die eben diese Performance 2011 gebracht haben warum hat sie es doch besser funktioniert das ist bis heute noch nicht so ganz verstanden aber ein Aspekt ist dass das Netz was Alex Kerry Schewski vorgeschlagen hat Neuronen hat sozusagen schichtenweise wie in Informationen verarbeiten aber im Gegensatz zu den achtziger neunziger Jahren nicht nur 3 Schichten sondern inzwischen bis zu 100 davon Schichten die hintereinander Informationen vor in den achtziger und neunziger Jahren war man der Meinung dass mehr Schichten nix bringen verschiedene Gründe warum man das geglaubt hat heute hat sich gezeigt mehr Schichten bringen offenbar doch was in der Tat in der Folge dieser Arbeit an Alex Skeletts diese Arbeit allein von 2012 bis übrigens über 20 Tausend Mal zitiert worden 25 Tausend Mal inzwischen das ist also mit Abstand die meistzitierte wissenschaftliche Arbeit in meinem in einem Umfeld und viele viele haben darauf aufgebaut das hat ein Riesenhai verursacht in der Community Mansiz warum weil einfach auf einem super wichtigen Problemen eine beeindruckende Performance plötzlich da war die man so nie für möglich gehalten in der Folge haben sich die Architekturen dieser neuronale Netze immer weiter verbessert 2014 2015 kam mit 14 kam ein Google mit raus dann gab sein Wissen der 2015 und hier 2016 die Version 4 des Google Netz und Sie sehen etwas ganz phänomenales inzwischen können wir den Menschenschlag eine Herausforderung die würde ich sagen für die der Mensch gemacht wurde für die sozusagen über Jahrtausende Evolution das klären optimiert worden das Erkennen von Objekten in natürlich umgehen und das ist für mich der wirkliche Durchbruch inzwischen können wir das neuronale Netz auf viele andere Probleme erweitern haben wir zum Beispiel letztes Jahr Arbeit gemacht wo wir gezeigt haben dass man auch Objekte in Videos sie sehen schon Pixel genau verfolgen kann wie das der Algorithmus kann also genau berechnen welche Punkte gehören zum Objekt welche Punkte gehören zum Hintergrund und das alles er sozusagen lernen aus Beispiel aus Tausenden und Millionen von gelernten barsch man kann auch völlig andere Probleme die weit über die Bildverarbeitung hinausgehen mit neuronalen Netzen angehen hier sehen Sie zum Beispiel
ein neuronales Netz was wir entwickelt haben für ein Problem in der Bio in
der Bioinformatik nämlich die
Vorhersage der 3D- Struktur von Protein wie Sie wissen sind Protein durch Aminosäure Sequenzen kodiert und die Frage ist wie er wir daraus ein Protein und wie sieht die 3 Struktur 3D- Struktur dies damit der Daten kodierten Prodi ins Haus seien sehr schwieriges Problem und er heutzutage gibt es einen Konsens dass man das direkt aus der Aminosäuresequenz das Protein Vorhersagen ist eigentlich nicht möglich was man oft macht ist dass man zur zu also an so genannten Contact merkt übergeht die besagt welche am Prodi ihnen sind mit wählen welche Strukturen hier sind mit welchen in Kontakt und dann kann man über so genannte homologe Sequenzen in ähnliche Sequenzen in anderen Organismen und was wir eben hier vorgeschlagen haben 2016 auf der größten schillernden Tagung ist dass wir über die homologen Sequenzen diese Kontakt mehr mit einem neuronalen Netz vorhersagen das heißt hier nehmen wir ganz viel Trainingsdaten von schon bekannten Protein Strukturen und können lernen wie wie sieht die diese Transformation von der
Aminosäuresequenz zu dieser Kontakt mehr aus Anlass der kann man dann die 3D- Struktur gerecht und das hat in der Tat sehr viel besser funktioniert als alle bisherigen Verfahren zur Proteinstruktur vorerst spricht man kann diese Technologie der neuronalen Netze die in der Computer wischen 2012 sozusagen in gewisser Weise ihren Ursprung hatte kann man anwenden auf völlig andere Datenanalyse Probleme wie zum Beispiel die Proteinstruktur vorhersagen ich möchte ihn heute ein bisschen mehr erzählen aus einem Bereich 3D-Rekonstruktionen ein Bereich der auch für aus der Computer wischen sehr zentral
in der Computer wischen sehr zentrales ein Thema mit dem wir auch im Alltag viel zu tun haben weil einfach die Welt in der wir leben eine dreidimensionale ist weil aber
unsere Augen immer nur zweidimensionale ab Bilder dieser Welt das Thema kennen Sie sie laufen also um die Welt rum sie sehen die Welt mit ihren Augen und was ihr Auge wahrnimmt sind solche zweidimensionalen ab Bilder hier zum Beispiel von Bild die Herausforderung für die wir als Mensch eigentlich tagtäglich lösen ist dass wir die Herren in irgendeinerweise 3D-Modelle unserer Welt erfassen aus diesen Bildern und die Frage ist wie kann man das in der Maschine werden sie auch das ist ein sehr schwieriges Problem und ich auch da würde ich sagen in gewisser Hinsicht schwieriger als Schach oder Go gesehen dass ich es mit auf dem Schach und Go Marke weil das in der
Öffentlichkeit erstaunlich viel Interesse findet die anderen Themen bisher etwas weniger dabei finde ich sie in vieler Hinsicht spannender zum Beispiel angenommen ich zersägen den Raum in lauter kleine Volumeneinheit dann heißt 3D-Rekonstruktionen faktisch das ich für jedes kleine Volumenelement hier zum Beispiel diesen kleinen Würfel dar frage ist dieser Würfel Teil meines Objekt ist oder nicht und da sehen Sie schon für einen kleinen Würfel gibt eigene 2 Möglichkeiten das ist ja einfach so ein bisschen ähnlich wie beim Schach wie viele Möglichkeiten gibt es das ist wichtig für die Informatik weil im Prinzip alle denkbaren Möglichkeiten müssen untersucht werden oder analysiert werden um zu wissen welche ist die richtige hier genauso ich frage für einen gibt es nur 2 Möglichkeiten wenn ich jetzt aber 2 Volumenelement denn neben anderen und ich frage wie für mögliche Konfigurationen gibt ist er dann sehen Sie schon die können entweder beide Objekt zahlen oder beide Hintergrund oder eine ist Objekt einer Hintergrund andere Objekt andere Hintergrund dann haben Sie also 4 Möglichkeiten für diese Zeit Volumen er Element und wenn Sie noch ein 3. Moksel dazunehmen dann steigt die Anzahl möglicher Objekt in der Grundkonfiguration um einen Faktor zwar den Handel per C 8 mögliche Zustände Objekt Objekt Objekt Hintergrund Hintergrund Hintergrund Objekt Objekt Hintergrund unserer haben Sie 8 mögliche Zustände für Informatik ist das eine relativ offensichtlich die Rechnung und Informatiker die in sehr schnell gesagt wenn sie kennen Volumenelement haben groß N dann ist die Anzahl möglicher 3D-Rekonstruktionen auf diesem gibt er 2 hoch N mit jedem zusätzlichen kriegen Sie den Faktor 2 mehr nämlich alle bisherigen Konfiguration einmal wo der Objekt ist sondern alle nochmal wo der entsprechende Hintergrund also doppelt so viel wie vor das ist relativ viel und da gehören Informatiker meistens auch weil sie sagen ok die Anzahl möglicher Lösungen wächst exponentiell mit meiner Größe mit der Anzahl der Buchse die ich kenne wie viel Boxen immer in der Praxis na ja für so ein kleines Volumen 512 x 512 x 512 ist ein kleiner Kubus nicht wirklich groß aber als sagen wir mal für für Beethoven reichts ja wenn Sie jetzt ganz München damit rekonstruieren wollten hätten sie eine sehr schlechte Auflösung der Stadt das würde dann die Haus nicht mehr ein Ochse haben bringt also nicht wirklich Sie sehen also das ist wirklich ein kleines Volumen nichtsdestotrotz auf dieser Skala in neulich habe ich mal ausgerechnet wollen wie viel das ist dann in meine Tochter die ist jetzt 80 geht schon zur Schule die hat sogar schon Taschenrechner also habe ich mir Taschenrechner geschnappt und das mal ausgerechnet ich weiß nicht ob Sie das mal probiert haben ja es funktioniert überhaupt nicht ich war schwer enttäuscht seit der Schulzeit habe ich glaube ich kein Taschenrechner nur verwendet wenn man mal einen tut er nichts das gegen sagte es künstlich berechnet Zahl der zu groß haben also muss sich dann im Kopf ausrechnen das Ganze schwer also zumindest Weise Menschen dann auch gut können also eine Abschätzung des verstehe er nicht warum das Gerät niemals eine ab jetzt weiß ich wer den programmiert hat den Taschenrechner ist eigentlich kein Aufwand man kommt sehr schnell darauf dass es etwa 10 noch 40 Millionen Konfiguration also die Anzahl möglicher Lösung ist nur 1 mit 40 Millionen 0 garantiert mir alles was sie beim Schach Schach es sind einfach sehr viele mögliche Lösungen und die Frage ist zudem welche ist die richtige das ist auch sehr viel schwerer glaube ich zu evaluieren als beim Schach wenn ich eine Konfiguration abzusagen wie gut passt die eigentlich zu den Bildern eine Herausforderung ist also wie kann ich sicherstellen dass unter allen diesen 10 Uhr 40 Millionen Lösungen ich meine Algorithmus mal Computerprogramm wirklich die beste Lösung finden wir haben das hingekriegt wir haben ein Verfahren entwickelt wo wir
bewiesen haben dass man in der Tat die beste Lösung effizient berechnet spricht unser Verfahren kann wirklich unter 10 Uhr 40 Millionen Konfiguration die beste aus den wie
das genau funktioniert möchte ich jetzt aus Zeitgründen nicht eingehen etwas technisch aber das heißt wir können zum Beispiel ein Volumen hier vorgeben und der Algorithmus gerade selber gesehen der Freies sozusagen hier
die optimale Rekonstruktion der aus dem Volumen optimale heißt hier immer in Bezug auf eine bestimmte Blüte Funktion die sozusagen mir sagt wie gut passt das zu den in der Folge haben wir das angewandt zum Beispiel hatten wir ein Projekt
dieses hier mit er dem Kunstmuseum in Bonn die haben eine Menge von griechischen Statuen diesen etwas überlebensgroß und was die wollten ist die wollten die virtualisieren und zwar deswegen weil diese Statuen aus Raum bewegen von ich glaube 18 Statuen sind ist die weltweit verstreut sind manche sind in Bonn manche sehen in Paris was für die Kunsthistoriker verlorengegangen ist ist das Wissen wie diese verschiedenen Statuen in einem Ensemble zusammen man weiß die haben ein Ensemble gebildet man weiß und das sind so Allegorien die dargestellt sind man weiß aber nicht wie die zusammengestanden haben und da die überlebensgroß und über die Welt verstreut sind kann man die auch schlecht alle in ein Gebäude zusammenbringen und dann darum schieben und da hat also mein Kollege erst in die Kunst der Wissenschaftler hat mich gefragt kann man das nicht mit ihrem Verfahren digitalisiert und ja es kann man man macht einfach dürften der normalen Kamera um macht 20 30 Fotos und dann kann unser Algorithmus vollautomatisch diese Statuen rekonstruiert man kann sogar noch viel mehr machen in genau genommen ist so wenn sie wenn sie nur 3 die rekonstruieren wollen von Staat und dann können sie auch so genannte Laser Scanner nehmen und die 1 gehen das ist sehr viel teurer als eine Digitalkamera haben Sie auch nicht alle sich Digitalkameras haben sie sich alle 30 das ist ein ganz wichtiger Punkt bei den Technologien die wir entwickelt ist immer die Frage wie relevant sind die für die Gesellschaft Kamera basiert Technologien sind extrem relevant weil jeder von ihnen auf Smartphone mindestens einen wenn nicht 2 Kameras mit sich rumträgt keiner von ihnen hat wahrscheinlich in Laser scan dabei nicht also von daher der Technologien die wir für Laser Scanner entwickeln würden würden nicht so richtig viel Absatz finden Kamera Technologien aber sehr wohl außerdem können Sie mit Kameras viel mehr machen als mit Laser und das ist ein Punkt und das ist auch der Grund warum auch in der Robotik die ganze Robotik Community über die letzten Jahre immer mehr von Laser scan weg kommt auch selbstfahrende Autos nutzen heutzutage noch Lasertechnologien aber wie lange muss man weder sind nämlich auch sehr teuer Kosten spielen Sie ja schon gesehen die 10 Euro kann aber zu teuer damals Kostenspirale ihren in ihrer Bedeutung in diesem technologischen und Laser Scanner Kosten Tausende von Euro die sind außerdem groß diesen schweren Kameras sind vielleicht da ich keine 20 Kameras in bauen heute wird das standardmäßig gemacht bei manchen Outfit und da habe ich also sehr viel Information und jetzt passen Sie auf was sich mit Kameras kann was ich mit Lesern nicht kann ist ich kann ganze Handlungen in der Zeit rekonstruieren ich kann also diese Handlung hier weil professionelle genauesten Herrn also gut vielleicht nicht professionell haben haben wir da in Kamerasystem gestellt mit 16 Kameras synchron gefährden und Sie sehen wir können zwischen die Handlung Zeit aufgelöst rekonstruieren Zeitschrift für Zeitschrift können wir die gesamte 3D-Struktur konnten wir können dann die Vorhaben aus den Bildern wieder auf die 3 die Struktur drauf Märkten drauf projizieren das können Sie mir mir dieser Scanner nicht der sieht ja gar keine Farbe und dann haben sie ein Abbild der Handlung von einem Blickpunkt Boni Kamera stand und das ist etwas was inzwischen in der x Community unter dem Schlagwort für die Viewpoint Tellerwäscher propagiert das heißt aus meiner Sicht eine mögliche Zukunft des Fernsehens das wenn sie irgendwie in nächsten Jahren er Sonntagabend zu Hause sitzen andere im Chor am Fernseher und ihren Tatort schauen dann können sie sich während die Handlung läuft aussuchen von welchen Blickpunkt aus wie die Handlung verfolgen ja weil die Maschine sozusagen eine intrinsisch ein 3-D-Modell der gesamten Handlung hat und was Sie hier sehen ist in der Tat wie und Heinz wenn Kertscher das ist die Handlung die die vor konstruierte Handlung wird in Echtzeit sozusagen visualisiert und der Benutzer kann völlig frei mit der Maus rumfahren rein so raus zu und damit kriegen Sie ein Gefühl was die Hollywood-Regisseure sehr sehr wichtig wenn im Englischen heißt es in Häuschen das Gefühl für den Zu Schauer das verwirklicht Teil der Handlung wird und wie besser Teil der Handlung werden als wenn ich wirklich zu zeigen mit der Maus ein Summen kann und den Blickpunkt so war er nicht gerne hier noch ein anderes Beispiel S Sendeverfahren da sehen Sie die Genauigkeit dieser Rekonstruktion ist inzwischen so hoch dass wir das gesamte sei langes Seil springen Mädchens rekonstruieren können allein aus dem Bilder das ist ein bisschen eine meiner wichtigsten Aufgaben den ich immer wieder dass ich als Professor in diesem Bereich viel Romreise in der Welt fiel auf Tagungen gehe viel Cooke Was ist der aktuelle Stand was passiert wo gerade jetzt gestern bin ich auch aus der Tagung in Bologna zurückbekommen und da sieht man immer was sich alles entwickelt und man entwickelt mit der Zeit und gewisse Intuition dafür wo noch was geht wo kann man noch Technologien entwickeln Formalismen Methoden wo ist sozusagen der aktuelle Wissensstand weltweit und vom wie geht es weiter dass es wichtig war wenn ich dann mit meinen Doktoranden an diesen Themen arbeitet muss ich denn da irgendwie eine Perspektive geben wo sie hinlaufen soll mit ihren Entwicklungen und da ist es wichtig dass sich ein Gefühl haben wo ich was möglich und typischerweise ist mein Gefühl relativ zuverlässig über die Jahre das sich Intuition hat was geht was sollte in den nächsten Jahren möglich sein allerdings manchmal wie ich auch falsch zum Beispiel hätte ich selber nie geglaubt dass man aus Kameras allein zogenau Rekonstruktion Bericht und als mein Doktorand Martin Oswald mir die Ergebnisse gezeigt hat da bin ich wirklich vom Stuhl gefallen ich sehe ja selbst dieses sei kaum in den Bildern also das ist schon finde ich durchaus beeindruckend wie genau die Rekonstruktion inzwischen sind andere
Beispiele dass es also jetzt eben mehr 3D-Fernsehen gewesen man kann auch 3 die Fotografie entwickeln das sind so genannte Tiefenkamera hast das ist rausgekommen mit der X Box von Microsoft das Kameras die Tiefenprofil erfassen bisschen verwandt zum Laser Scanner wir haben Technologien entwickeln da können Sie eine Person auf dem Stuhl so rum drehen und Sie sehen im Hintergrund entsteht in Echtzeit ein farbiges 3-D-Modell und zwar in völlig dichtes farbiges Modell an der vielleicht das können Sie dann auch ausdrucken er und dann haben sie lauter Miniaturen von sich von sich von Freunden Familie sei so Fotografie in 3 und anstatt dass sie als ein Foto Album ins Regal stellen können Sie wirklich so zu sein anfassbarer Kopien der Menschen generieren und Sie haben es gerade gesehen super leicht einmal auf dem Stuhl umdrehen fertig gedacht war Autismus an diesem Akt der seine 2013 als die Arbeit auch Ausgaben haben eine Firma gegründet um das zu vermarkten ich glaube bis heute dass da ein Riesenmarkt ist wo der allerdings genau ist kann ich Ihnen nicht wenn Sie da eine Idee haben wir sind die ja ich habe viele Ideen Tauchzeiten Kinder zum Beispiel wenn ich Sie unsere Kinder die ihren wenn Fotograf zweimal im Jahr kommt der Fotograf und ist für allein 4 Farbfotos verlangte dann 50 Euro durch den das kann man auch gleich ein 3-D-Modell zudem ab ja also wir also da gibt es sicher noch Möglichkeiten das Hauptproblem bei der Firma wir hatten nie jemand der die Business-Seite abgedeckt und sie können sich vorstellen ohne das ist ein bisschen doof ja trotzdem habe ich
die Hoffnung noch nicht aufgegeben dass man in dem Bereich in die was sinnvolles auch machen kann im Transfer in die und die Gesellschaft hier sehen Sie so ein paar Beispiele
von im Personen und 3D-Modellen Sie sehen die Modelle sind schon sehr detailliert und aufgelöst inzwischen wurde
Entschuldigung dass hat ich vergessen der Firma hatten tun sie könnten das ist Hermann unser Präsident und das ist ein Verfahren das sehen
Sie das ist die nächste Generation von den denn da kann man jetzt muss man nicht die Person auf dem Stuhl umdrehen war das für den Präsidenten fand ich ein bisschen mühsam ist Stuhl zu und dann haben wir gingen wegen wo einfach sein Roboterarm um fährt und dann entstehen in ganz klar aber der sozusagen Miniaturen und das war jetzt gerade Anfang des Jahres habe man ist ja da sehr Pioniere in vieler Hinsicht Wissens habe es auch in der Tat die dritte Person die sich da in diesem Scanner reingetraut hat da könnte ich gut genau man kann er ich habe jetzt sehr viel über 3D-Rekonstruktionen gesprochen her nicht so sehr viel darüber dass man auch die Bewegung der Kamera mit berechnen verfolgen
kann das lässt sich auch man jetzt einfach das finden sich in der Community Ziel haben dieses Problem das steht für 10 Otellini es
locker leise ich nie mehr ist ein Begriff der sich etabliert hat und das heißt ich bestimme wo die Kamera sich rum bewegt hat und der rechte gleichzeitig 3 die 3D-Rekonstruktionen der Welt so wie sie hier sehen und das sind jetzt wirklich sehr große Rekonstruktion nicht nur Beethoven Größe sondern wirklich der Straßenzüge wenngleich noch mehr Beispiele und sie sehen da entsteht ne ganze dreidimensionale Welt und das schöne ist dieses Verfahren das läuft in Echtzeit aufnehmen wird ganz normal auf CPU sie können also eine Kamera an der Glaube anlegen können damit durch die Welt laufen Tränen draußen egal und das Verfahren verfolgt ihre Kamera sehr genau ich komme am Ende noch dazu wie genau aber schon vorab kann ich sagen die Verfahren die wir über die letzten Jahre entwickelt haben sind die aktuellen weltweit genausten Verfahren zum Verfolgen von Kameras was kann man damit machen zum
Beispiel kann man damit Drohnen autonom fliegen lassen Drohnen ist auch so ein Thema was in
den letzten Jahren in die Medien gekommen irgendwie ist es erstaunlicherweise so dass viele der Technologien an den wir seit Jahren forschen in den letzten 4 5 Jahren in die Öffentlichkeit gekommen sind das war damals noch nicht so wie ich habe zum Beispiel 2007 angefangen das ist Foto 2007 noch einmal in Bonn ein Büro mit Drohnen zu experimentieren mit der Quadrokopter an denen die immer lieber Quadrocopter weil man da nicht die Militär Association hat die der Normalbürger bei den Begriff Drohne oft hat ich glaube das ist nämlich auch sehr viel Zivil- und nützlichen Einsatz von Drohnen gibt daran arbeiten wir sehr stark wir haben anfänglich die Drohnen selber gewahrt die Quadrokopter inzwischen kann man die kaufen das ist
eine französische Firma hält das ist ein Spielzeug ging das Kost ungefähr 250 Euro das ist ein etwas teureres von einem Münchener Staat hat es Henning Technologies diesen neulich von Intel aufgekauft worden und das ist in ganz kleine sie sehen diesen inzwischen so klein dass die passen und gerade die sind glaube ich in der Interaktion mit Menschen sehr gut die mag ich besonders gerne wenn die ihn an Kopf liegen zum Beispiel merken sie kaum oder wenn sie gegen die
Wand weg da geht wieder die Wand kaputt und das auch richtig noch das Gerät können Sie dies kann sie also auf die fliegen gleich sein bis zur Wende fliege wenn sie mal gesehen haben wenn Fliege ins Fenster fliegt die kann 50 mal rein fliegen immer wieder und wieder mal fragt sich manchmal wandern zu aber das eine andere Frage wenn Sie dann ein dagegen Vogel nehmen oder was grösseres sowas fliegt typischerweise nur einmal ins Fenster es hat in
der das ist bei der Norbert kann nicht anders wie diese großen da muss man schon aufpassen aber mit den kleinen können sie lustige Sachen machen hier so ein paar Beispiele ein das ist der Uli danke
hat das in seiner Masterarbeit entwickeln nämlich ein System erst mal was man mit Gesten steuern kann das haben wir im Zentrum in München einen morschen Catcher System aufgebaut darf und das sieht man wir haben da so markante werden verfolgt und will die können sehen wo ist das Gerät wir haben auch Marke an dem kleinen eine der kleine Drohne und dann ist die die so programmiert dass sie immer einen fixen Abstand von diesem zeige Instrument des ja und das wozu das gut es komme ich gleich noch drauf wer nach meinen Sie können sich vorstellen dass die Jungs da begeistert dran forschen wozu das gut ist Fragen die oft gar nicht sein immer meine Aufgabe zu überlegen kann man das auch nützlich einsetzen sie sehen hier ganz schön die Zentrifugalkraft Inhalt zurück wenn man sich zu schnell dreht sich das aus der Kurve aber sie sind auch die Dinge gehen halt nicht kaputt man kann die dann gleich weiterfliegen lassen dann kann man die
Kamera drauf machen das ist nicht so einfach weil die Nutzlast sehr geringes das heißt man muss sich der viel Gedanken machen wie und hier ging das auch nur mit analog Kameras weil die Übertragung digitaler Bilder mehr Gewicht auch braucht man sozusagen mehr Gewicht analoge kann man mit der kleinen Antenne übertragen und dann kann ich Bilder von dem Gerät machen hier und da sehen Sie sozusagen das was die was die Drohne gerade sieht das ist ganz schön dass es eben auch sie können keine Leser Scanner auch so ein kleines Ding also können sie aber dann fliegt halt nicht mehr nicht geht dann nicht mehr er nicht für richtig nützlich mit Kameras aber schon da sehen Sie hier unten was die Kamera sieht das ist etwas professionelleres bräunt denn die weiß also Sonne Wasser dann genommen hat und sie sehen auch hier ist das wieder genau der gleiche Algorithmus und natürlich das das erste was jeder vernünftige Mensch macht ist sie für die zerfließen machen Großteil der Bilder im Internet aus der Firma und hier sind Sie also auch man kann damit schöne Selfies machen und ich sags mal so es wäre gar kein Problem jetzt die Drohne so zu programmieren dass Dietmar das Gesicht genau
im Zentrum des Bildes hält und immer den gleichen Abstand zum Gesicht da brauche ich auch keine zeige die weiß oder irgendwas das es sie mit Computer wischen sehr leicht lösen und so ähnlichen Verfahren haben wir auch schon entwickelt und dann können Sie das System nutzen um zum Beispiel von zu Hause zu Skype kann ja und dann haben Sie die Kamera auf der Drohne und das Mikrofon das funktioniert habe ich schon im Beispiel gesehen und dann können Sie in Ihrem Raum rumlaufen die Drohne folgt den immer und stellt sicher dass Sie immer im Zentrum des Bildes das so beispielhafte Anwendungen von von Computer wischen und Autonomen der System hier noch ein bisschen was Beispiel zu
Autonomie wir können also die Dinge so programmieren dass die allein mit dem kann was sich im Raum lokalisieren können er hier sehen diese die 3D- Position wo die kommen der Computer glaube zu sein gerade und dann können sie vorgegebene Muster abfliegen völlig out im Gegensatz zu den meisten Quadrocopter die sie in der Öffentlichkeit gesehen haben ist dieses Ding nicht Menschen gesteuert sondern von Computern gesteuert das also kein Mensch sondern ein der Taube der autonom er das System steuert und entweder musste abfliegt oder hier in dieser Aufgabe er hatte die Aufgaben liegt einfach nur an einem Ort im Raum zu bleiben und dann kommt der Entwickler Jakob Engel der hat das in seiner Masterarbeit entwickelt und den bösartig hier ist Schubser das aus der Bahn geht dann hin und lenkt es aus woanders hin und wiesen kleiner Hund findet das immer wieder zusammen Körbchen zurück und Sie sehen erhält dann auch die Kamera 2 hält den nach unten zeigenden Ultraschallsensor zu alle Sensoren den zugehalten trotzdem findet das Verfahren sehr schnell wieder zurück zu seinem ursprünglichen period und zwar extrem robust hier sehen Sie noch ein Beispiel wo das richtig in den Schrank reinknallt wo es eigentlich gar nix mehr von der vertrauten Welt sieht aber es dreht sich um sofort wieder zu sehen Sie also so Beispiele von Computer wischen und 3 die Lokalisierung der in echten
Anwendungen man kann die Sachen auch kombinieren hier sehen Sie dieses 3 direkt
Konstruktionsverfahren haben wir diese 3D-Kamera auf der Drohnen die ist etwas größer weil das mehr Gewicht ist diese Kamera und da sie größer ist haben wir sie wie sollen den Hund an der Leine damit wenig ausbüxt aber die Fliege autonom rum und im Laufe des Fluges entsteht ein farbiges 3-D-Modell des Raumes sie können also Drohnen jetzt entwickeln so wie Sie es hier
sehen die voll autonom ihre Umgebung der explorieren und im Rahmen der Exploration habe 3D-Modelle der Umgebung entstehen lassen und wenn Sie sich vorstellen wie lange ein Mensch braucht mit mit entsprechenden Technologien Sonderraum auszumessen ist natürlich der Vorteil ganz offensichtlich einfach die Drohne hinstellen Knopf drücken und wenn sie fertig ist ist der Raum voll erfasst
und das haben wir in der Tat über die letzten Jahre weiterentwickelt das sind auch so autonome Drohnen die sich im Kreis Rom bewegen wenn der normalen Kamera jetzt hier in die ob Pänz Sigriz das heißt berechnen wo es Freiraum wo kann ich fliegen wo nicht ja und dann
explorieren Tatplanung machen und ich esse ich sie Zeit geht hier langsam zu Ende sind und
wenn ich ein bisschen schneller werden weil ich hier noch ein anderes Beispiel das ist ein etwas aktuelleres
Verfahren das nicht ganz richtig ist es dieses Jahr erschienen 2018 zu aber auch inzwischen schon über 100 Mal zitiert worden die Arbeit haben da haben wir eine Kamera mit der wir durch die U-Bahn in Garching laufen und Sie sehen ich kann die Kamera verfolgen durch den ganzen U-Bahn-Schacht hindurch wieder Haus zurück mit einer Genauigkeit Herr sie sehen sich verfolge also immer weg bewegt sich die Kamera wie dreht sie sich nicht versteht sie sich von Bild zu Bild und das sind Tausende von Bildern ich man natürlich immer kleine Fehler in dieser Schätzung die sich akkumulieren das nennt sich dann driftet der Community ist es sich eine Verschiebung ein Krieg und die sehen Sie hier das Fahrrad was hier steht es zweimal rekonstruiert worden das heißt das ein Versatz entstanden über diese ganze Strecke aber wie groß ist dieser Versatz der Versaces ungefährlich für Versagen 2 3 Meter auf eine Laufstrecke von Hunderten von Liebe sprich die Genauigkeit dieses Verfahrens ist unter einem Prozent wir haben das
versucht möglichst präzise zu evaluieren dazu haben wir wirklich viele viele Bilder 101 Minuten an wenige aufgenommen mit verschiedenen Linsen mit verschiedenen Kameras drinnen draußen über alle in sehr unterschiedlichen Umgebung auch mit sehr schlechten Sichtverhältnissen und so einfach um was repräsentatives zu haben und dann haben wir evaluiert wie genau ist das Verfahren und haben uns
verglichen mit dem was er in der Fachwelt als der steht auf die Art bezeichnet wird ein Verfahren aus Saragossa das heißt ob laden und hier sehen Sie die
Plotz und vereinfacht gesagt je weiter links oben sie landen desto besser was wir gezeigt vielleicht konkret ist dieser in dieser Versatz pro Sequenz wir haben ja 500 verschiedene Videos die dadurch Nudel das ist der Vorsatz den wir verzeichnen während das wer im Wald zu zu dem sie sehen schon dass wir zum Beispiel wenn man jetzt hier haben summt und guckt Versatz von 2 da da können die Konkurrenten nur 100 Sequenzen mit so einer Genauigkeit verfolgen und wir können 400 Sequenzen oder entsprechen wenn sie sagen sie wollen die Besten weiß sie nicht 400 Sequenzen dann haben wir einen Versatz von 2 und die armen Versatz von ich weiß 10 zu also deutlich größerer Präzision Größe ist größere Robustheit in diesen verschiedenen vieler Maß und das ist wie gesagt wir aktuell das weltweit genaustens war mit Abstand sie können solche Verfahren dann
auf die Autos hier sehen Sie eine von 2 Kameras das ist eine Erweiterung auf 2 Kameras und da sehen Sie wir können in Echtzeit die ganze Welt vor dem Auto rekonstruieren in einem sehr hohen Detailgrad und einer sehr hohen Präzision und Sie sehen die Präzision ist so hoch dass wir nicht einmal um Block Faber passen die Strukturen zusammen das heißt ich
kann Kameras in Autos einbauen so wie hier und sie können in Echtzeit die ganze Welt vor dem Auto rekonstruieren und wenn Sie sich jetzt noch vorstellen dass Sie so eine Kamera Systemen in jedes Auto packen was in der in Deutschland um fährt dann hätten sie sehr schnell eine relativ vollständige 3 die Kartierung von Deutschland und das ist wichtig für selbstfahrende Autos eine Erfassung der 3 D Welt in der die fahren sollen um Hindernisse zu erkennen um Hindernisse zu vermeiden und so weiter also haben wir gedacht da müsste doch auch in Mark zahlen 2. Versuch
viermal und also haben wenn die Firma gegründet
in letztes Jahr schon oder von der weil eigentlich schon in den mit 2 Partnern diesmal haben wir Leute die wirklich auch den besten ist Teil abdecken ich habe was dazugelernt aus den Erfahrungen zum Beispiel habe Anfang des Jahres über 4 Millionen 1
geworden an Investorengeldern für dieses Data Artist 1 und da werden quasi Technologien entwickelt weiterentwickelt zum Beispiel ist das ein 1. Prototyp das ist ein Foto von diesem Prototyp sieht ein bisschen künstlich aus das ist wirklich ein Foto von dem Prototyp werden und das sind 2 Kameras drauf und mit denen kann man dann in die Welt rekonstruieren das expandiert gerade sehr wir sind sehr auf der Suche nach Talenten für die Firma nach potenziellen Kunden im Automotive Bereich und in also insbesondere Motor und potenziellen Business Park und da muss ich sagen bin ich etwas zuversichtlicher dass das wirklich auch abgeben wird lassen Sie mich zusammenfassen ich habe über viele Themen gesprochen im Bereich Künstliche Intelligenz von den eher klassischen Problemen wie Schach oder Go bis hin zu den er am oder anderen Themen Bildanalyse
Bild verstehen hier 3D-Rekonstruktionen von Objekten von Museum Statuen beispielsweise 3 die Rekonstruktion von Handlungen auch über die Zeit ich habe über dieses Lernproblem gesprochen dass sich die Welt rekonstruieren will und die Kamera in Echtzeit verfolgen will habe gezeigt dass man solche Systeme für autonom Drohnen oder Quadrocopter einsetzen kann und aber eben auch für selbstfahrende Autos vielen Dank für Ihre Aufmerksamkeit
der vielen Dank Daniel ich hier sehe ist es im Vergleich zu den fordert vom letzten Jahr auch
wieder was dazugekommen also dann sieht man auch wie rasant sich die ganze Sache entwickelt was sich auch sehr interessant fand ist das am Anfang wurde von den Schachcomputern geredet hast auch mit dem C 64 das hat mich auch an meine Anfänge erinnert ich hatte darin Commodore das war noch vor dem C 64 und da gab ein Schachprogramm sorgen 2 ist es dann kann mich noch erinnern und das konnt ich nur auf Stufe 0 es glauben 0 bis 9 schon morgen da habe ich aber eher nicht probiert war ganz stolz also Stufe 0 schlagen konnte aber ab 1 stehen das Handeln mit der nach das ist sehr Stufen einer bei der Auswahl der vorzulesen sind der gut ja sorgen ja Alexander Brausch meine Frage wer auf diese Objekt Verfolgung in in Videos wenn sie hat mir diesen diesen Surfer können sie das auch in Menschenmengen ja schon auch also das müsste man im Einzelfall analysiert aber im Prinzip ja und das sind natürlich Technologien die auch für Überwachung im Zweifelsfall Einsatz im Unterricht aus mehren M E nicht um mit glaube die statischen Kameras haben praktische Vorteile das habe ich nicht angesprochen aber Drohnen haben sehr begrenzte Batterie typischerweise 10 Minuten von daher ist für uns auch enorm wichtig dass die Batterietechnologie sich weiterentwickelt dann wird ja auch viel Arbeit rein gesteckt dass man etwas längere Flugzeiten hat und so in Sachen von der Drohne auszumachen ist hat zusätzlich schwer dadurch dass die Drohne sich selbst bewege kriegt man so Motion wieder ein und dann wird die die Bildverarbeitung deutlich schwieriger aber gibt es natürlich auch Anwendungen allerdings war glaube ich zuerst für also links von mir aus rechts vom Publikum verknüpfen Sie bei dem Thema selbstfahrende Autos aber ihre Konstruktions- und Sichtweisen dann aus dem System mit nach eine Information die Sie jetzt zum Beispiel über Android-Systemen kriegen und nachher dann die Objekte besser erfassen zu können dass sie Fehler ausschließen er Mann wie optische Erkennung Doktor nun Saddam-Söhne und sollen die elektronische Regelung ja das machen wir bisher nicht einfach deswegen weil das Verfolgen von Android-Systemen ist etwas da muss man mit Google enger zusammenarbeiten um das hinzukriegen wir haben einige Kooperation mit Google aber nicht in der Richtung er ist auch ein spannendes Thema insgesamt da habe ich es heute nicht so viel drüber gesprochen werden wie ich sozusagen die Kamera als Sensor fusionieren mit anderen Sensoren zum Beispiel Android Erfassung GPS in der Zahl Sensoren Radar Lidar was es alles gibt Ultraschall gibt sehr viele Sensoren die im Auto Einsatz finden sowohl Sensoren auf dem Auto als auch externe Sensoren an Straßenkreuzungen oder so wie man diese ganzen Sensordaten fusioniert ist eine sehr wichtige Herausforderung man möchte einfach maximale Robustheit hat aber schon jetzt sind diese Verfahren erstaunlich robust ist etwas was in der Öffentlichkeit oft nicht erwähnt wird da wird dann er groß propagiert das eben Uber zum Beispiel eine Person totgefahren hat das ist das durchaus bedauerlichen natürlich aber man darf nicht unterschätzen dass nicht übersehen dass in die aktuellen selbstfahrenden Autos schon sehr viel sicherer fahren als der durchschnittliche menschliche die entsprechenden Unfälle kriegt man ja in der Öffentlichkeit alle nicht vor also das indes wird die da ist die Wahrnehmung und manchmal ein bisschen verzerrt in der Öffentlichkeit wie gut die Systeme jetzt schon sind was sie sehen müssen ein großer Vorteil lernender Verfahren ist dass die aus Erfahrungen lernen und sie können ganz sicher sein die Sequenz wo die des Ober- Autodiva Frau totgefahren hat die wir tausende Male durch alle neuronalen Netz Systeme durchgespielt mit dem Ziel das man so was ähnliches nochmal passiert das System dann nicht denselben Fehler 2 und dieses Fähigkeit aus Erfahrung zu lernen haben menschliche Fahrer nur sehr eingeschränkt sie können nur aus ihren eigenen Fehlern nicht aus Fehlern anderer bei Computer ist das anders ein Computer lernt aus den Fehlern alle selbst an den Ort ich denke da die Zeit fortgeschrittenes machen noch 3 kurze Fragen kurze Antwort wenn es geht und dann immer zum nächsten fordern über der schönen Dank Herr Professor Kremers mich hat auch am stärksten die 3D-Rekonstruktionen aus Bild Bewegtbild Informationen beeindruckt und damit konnte er ist auch schön gezeigt werden wie etwa für den Straßenverkehr mehr sozusagen 3 die ab Bilder der Jahre Welt simuliert werden können völlig verstanden jetzt ihr in Frage Zukunft der künstlichen Intelligenz es ist ja mit diesem 3D-Bild jetzt zunächst für die Maschine noch keine Weltverständnis entstanden ist ist ja zunächst mal nur ein nicht ontologisches ab Bild eines in Form eines 3D-Modelle Star wie kommen Sie dazu im Kontext mit Daten Fusionen etwa ontologische semantische Informationen damit zu verknüpfen so dass das Bild Datum auch verknüpft werden kann mit Objekt bezeichnet Tisch Stuhl Hausbaum Fahrradfahrer er er
wisse sehr wohl der Fall ist haben wir schon gemacht ich habe erst Zeit wollen jetzt keine Ergebnisse gezeigt die Art wie sie das machen würden und so machen wir es auch ist heutzutage würden Sie die geometrischen Re Konstruktionsverfahren die wir entwickelt haben kombinieren mit neuronalen Netzen Semantik würden sie heutzutage typischerweise mit neuronalen Netzen extrahieren weil das platt gesagt am besten funktioniert sie haben die Platz selber gesehen von den Fehlern oder der Genauigkeit die ich mit Deep Learning Verfahren erziele bei der Extraktion semantischer Information und das kann man auch pixelgenaue machen also so Segmentierung und das kann man auch im 3D-Raum machen und dann haben sie die gleichen 3D-Rekonstruktionen nur dass die Objekte Autos Häuser Bäume Straße alles unterschiedlich farbig markiert sind das heißt dass funktioniert so da hinten auch dann noch der hatte sich glaube ich gemeldet und dann sollten zum nächsten Vortrag über den meinst du dass sich der Begriff der Intelligenz auch wieder verschiebt jetzt wo er eben ein reines Netz Katzen erkennen kann dass man sagt er also schwierig weil das doch auch nicht das können Sie das es nicht mehr intelligent wahrgenommen wird und wenn ja was ist dann der nächste Stufe für die Intelligenz im ja ich glaube der Begriff Intelligenz und was man unter Intelligenz versteht wird sich weiter verschieben ich muss zugeben ich habe aufgehört mich dafür zu interessieren mich interessiert nicht so sehr wegen geringer für definiert sind sondern eher wie man sozusagen die Möglichkeiten weiterentwickelt Herr zum Nutzen der Gesellschaft sie müssen jetzt nur radikale Antwort viele Leute wollen wissen Herr Kremers was ist denn die Definition von Intelligenz ich war es sieht man kann sich im Terminologie Definition auch verlieren das bringt die Wissenschaft nicht immer zumindest zumindest sagen wir mal meinen meine Interessen Bereich an der Wissenschaft ich glaube da gibt es andere Leute die vielleicht etwas kompetenter sich auch über Definition Gedanken machen können vielleicht auch über Etymologien von Begriffen Gedanken machen ich mich ich es nicht so spannend einfach als als Frage aber ich glaube es entwickelt sich weiter und wird sich auch weiterhin ich habe eine Frage zu wie viel Angst ich jetzt quasi vor diesem System haben muss wie realistisch ist das oder um welche Daten es er geht es ja gesagt sie kann direkt diese Rekonstruktion auf normalen trotz machen das heißt die Datenmenge muss quasi auch hinreichend klein sein damit das im verarbeitbar ist zur Anfang von Google Maps hat Innenpolitiker mal gesagt dass es total super wir brauchen jetzt keine Polizist die rumlaufen wir können einfach Internet bei Google Maps nach schauen wer wo was macht wenn jetzt Kameras und Fahrzeugen haben diese die diese Rekonstruktion machen am Ende relativ gutes LTE-Netz können diese Daten wie ein zentralisiertes darüber tragen wie realistisch ist das oder welche Datenmengen handelt es sich um tatsächlich ein Echtzeit 3-D-Modell über das Internet für jeden so zur Verfügung zu stellen sogar in dessen gute Frage gerade wo sie sagen für jeden zur Verfügung stellen ich erlebe es immer wieder gerade in der Öffentlichkeit auch in der Zeitung liest man das immer wieder mit dem Konzept künstliche Intelligenz vor dem vermischen sich sehr viele Ängste in der Öffentlichkeit sehr viele Ängste verschiedener Art ist es oft ein bisschen die Fuß und schwer rauskriegen was genau die Ängste sind ich glaube typisch für Deutschland ist vielleicht ein kulturelles Phänomen einer Frage nach sind deutsche insgesamt er sozusagen immer konservativer was neue Technologien angeht in Amerika zum Beispiel werden die mit Begeisterung aufgenommen hier ist in meine Skepsis da vielleicht auch berechtigt durch aus Deutschland zum Beispiel ist es glaube ich sehr stark im Bereich Datenschutz haben wo in Amerika sich manche Leute überhaupt keine Geldsorgen oder Gedanken machen die Zentrale für Datenschutz ist nicht zufällig in Deutschland in München bei die sagen Datenschutz spielt in Deutschland eine sehr viel stärkere Rolle Datenschutzes eine Angst dass seine Privatsphäre öffentlich gemacht wird dass es zum Beispiel für uns eine große Herausforderung der Firma wir dürfen zwar Daten aufnehmen aber Gesichter dürfen nicht zuerkennen seinen Nummernschilder auch nicht und das heißt wir müssen Technologien bevor wir sie alle zeigen in den Markt bei müssen wir garantieren dass das alles ausgefiltert und nicht gespeichert wird und das sind also wichtige Fragen die man klären muss aber ich bin da nicht besorgt ich bin zuversichtlich dass man alle diese Fragen lösen kann Datenschutz ist ein Problem nach andere Angst ist immer wieder das künstlich intelligente Systeme die Macht über uns Menschen übernehmen zurückkamen Äther Fantasien komme das halte ich für sehr abstrus ist sagte er meine Erfahrung ist wenn das System das macht womit ich nicht zufrieden bin das kenne ich schon seit ich mit dem Commodore 64 angefangen hat man schaltet den ab und bootet gehen neue geht aber tatsächlich könnten Sie zu der zu der Datenmenge noch was sagen zumal wenn voller Angst ob das realistisch ist in durchaus realistisch über und worauf wir aber sehr stark setzen ist auf Cloud Computing das heißt dass Daten in die Cloud transferiert werden und sagen wir mal sehr rächen Int und brechen und speicherintensive Sachen in der Cloud passiert sprich wenn Sie so eine Vision haben das sie solche 3D-Rekonstruktionen auf allen Autos laufen lassen dann würden diese Autos ihre Daten und Teilrekonstruktion in die Cloud geben und dort würde ein vollständiges Modell von Deutschland entstehen nicht auf den die werden das nur so weit kriegen wie sie es für erfahren ein benötigen sonst ist das einfach nicht skalierbar da muss man sich als Techniker genau Gedanken machen was muss Unwort laufen was kann in der Cloud laufen und da arbeiten wir auch sehr stark
Bildverarbeitung
Punkt
Informatik
Wechselsprung
Künstliche Intelligenz
Mathematik
Bildverarbeitung
Maschinelles Sehen
Objekt <Kategorie>
ECCE <Programm>
Maschinelles Sehen
Information
Struktur <Mathematik>
Geschwindigkeit
Zugbeanspruchung
Punkt
Momentenproblem
Physik
ECCE <Programm>
Mischung <Mathematik>
Berechnung
Bildverarbeitung
BEEP
Bildverarbeitung
Algorithmus
Eigenwert
Informatiker
Autonomer Roboter
Optimierung
Soundverarbeitung
VIC 20
Mathematik
Heuristik
Künstliche Intelligenz
Entscheidungsbaum
Roboter
Heimcomputer
Schachcomputer
Künstliche Intelligenz
Datenverarbeitungssystem
Strategisches Spiel
Dimension 3
Haar-Integral
Wort <Informatik>
Maschinelles Sehen
Information
Shape <Informatik>
Neuronales Netz
Objektklasse
ImageNet
Matrizenmultiplikation
Pixel
Punkt
Momentenproblem
Google
Physik
Bildverarbeitung
Hausdorff-Raum
Architektur <Informatik>
Whiteboard
Zahl
Bildverarbeitung
Objekt <Kategorie>
Datensatz
Bildsegmentierung
Algorithmus
Widget
Version <Informatik>
Information
Abstand
Ecke
Neuronales Netz
Rechenzentrum
Bioinformatik
Prognose
Prognose
Anwendungsspezifischer Prozessor
Anwendungsspezifischer Prozessor
Struktur <Mathematik>
Atomarität <Informatik>
Neuronales Netz
Prognose
Dreidimensionale Rekonstruktion
Datenanalyse
Anwendungsspezifischer Prozessor
Bildverarbeitung
Atomarität <Informatik>
Neuronales Netz
Dreidimensionale Rekonstruktion
Faktorisierung
Programm
Relaxation
Zahl
Lösung <Mathematik>
Algorithmus
Informatiker
Würfel
Zustand
Abschätzung
Maschinelles Sehen
Volumen
Taschenrechner
Konfigurationsraum
Gewichtete Summe
Punkt
ECCE <Programm>
Relaxation
Plot <Graphische Darstellung>
Hausdorff-Raum
Allegorie <Mathematik>
LES
Roboter
Algorithmus
Menge
Perspektive
Optimale Rekonstruktion
Maschinelles Sehen
Volumen
Information
Softwareentwickler
Smartphone
Downloading
Microsoft
Demo <Programm>
Dreidimensionale Rekonstruktion
Informationsmodellierung
Downloading
Echtzeitsystem
Demo <Programm>
Dreidimensionale Rekonstruktion
Objektverfolgung
ECCE <Programm>
Kurve
Abstand
Internet
Algorithmus
Digitalsignal
Anwendungssoftware
Abstand
Hausdorff-Raum
Position
Datenverarbeitungssystem
Integration <Mathematik>
Anwendungssoftware
Internationalisierung <Programmierung>
Softwareentwickler
Kreis
Laufzeitsystem
RSS <Informatik>
Raum <Mathematik>
Bahnplanung
Strecke
Meter
Schätzung
Bahnplanung
Mathematische Größe
Laufzeitsystem
Ruhmasse
Robustheit
Abstand
Linse
Erweiterung
p-Block
Systems <München>
Struktur <Mathematik>
Künstliche Intelligenz
Bildanalyse
VIC 20
Mathematische Größe
Dreidimensionale Rekonstruktion
Google
Objektverfolgung
Ultraschall
Künstliche Intelligenz
Plot <Graphische Darstellung>
Humanoider Roboter
Zahl
Richtung
Objekt <Kategorie>
Bildverarbeitung
Schachcomputer
Bewegung
Anwendungssoftware
Bewegtes Bild
Information
Robustheit
Inkonsistenz
Fusion <Programm>
Systems <München>
URL
Neuronales Netz
VIC 20
Objekt <Kategorie>
Dreidimensionale Rekonstruktion
Datenmissbrauch
Internet
Echtzeitsystem
Künstliche Intelligenz
Information
Systems <München>
Innerer Punkt
Streuungsdiagramm
Neuronales Netz

Metadaten

Formale Metadaten

Titel Vergangenheit und Zukunft künstlicher Intelligenz
Serientitel Das digitale Chamäleon - Gesellschaft und Technologie im Wandel
Autor Cremers, Daniel
Lizenz CC-Namensnennung 3.0 Unported:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
DOI 10.5446/37027
Herausgeber Akademie für Politische Bildung (APB) Tutzing
Erscheinungsjahr 2018
Sprache Deutsch

Inhaltliche Metadaten

Fachgebiet Informatik
Abstract Die Digitalisierung ist endgültig in der Mitte der Gesellschaft angekommen. Von Großcomputern bis zur Datencloud hat das digitale Chamäleon schon oft seine Farbe gewechselt – und macht weiter damit: Internet der Dinge, künstliche Intelligenz und Blockchain-Technologie erfordern interdisziplinäre Anstrengungen in der Wissenschaft und Diskussionen auf gesellschaftlicher Ebene. Unsere Tagung mit der Gesellschaft für Informatik und der Initiative D21 verknüpft technische Expertise und politisch-gesellschaftliche Dimension. Leibniz-Preisträger Prof. Dr. Daniel Cremers leitet die Computer Vision Group der TU München, einer seiner Schwerpunkte ist die 3D-Rekonstruktion. So können 3D-Fotos mit Tiefenkameras oder 3D-Videos durch mehrere Aufnahmen derselben Handlung entwickelt werden. Die Rekonstruktion erfolgt dann durch Algorithmen. Diese Technologien ermöglichen beispielsweise eine Kameraverfolgung in Echtzeit - schlussendlich könnten Zuschauer einen Film gleichzeitig aus unterschiedlichsten Perspektiven verfolgen und direkt in die Handlung eintauchen (Immersion). Oder wie wäre es, wenn eine kleine Drohne bei der nächsten Skype-Konferenz regelmäßig in zwei Metern Entfernung vor Ihnen herfliegt; oder nach einer Naturkatastrophe unzugängliche oder zerstörte Gebiete abfliegt? Was Künstliche Intelligenz bis zu diesem Zeitpunkt an Datensätzen erfasst und ausgewertet hat - zum Beispiel alleine, um einen Kopf mit all seinen Nuancen, verschiedenen Gesichtsausdrücken und im Licht wechselnden Schattierungen richtig zu erfassen - ist kaum vorstellbar. Unser Tagungsbericht: https://www.apb-tutzing.de/news/2018/digital-diskutieren.php

Ähnliche Filme

Loading...
Feedback