Bestand wählen
Merken

01 Semantic Web Technologien - From Internet to Web 2.0

Zitierlink des Filmsegments
Embed Code

Automatisierte Medienanalyse

Beta
Erkannte Entitäten
Sprachtranskript
ja recht herzlich willkommen zu Semantik Daten oder ist ja Vorlesung jetzt Wintersemester 2012 2000 13 werden heute 2 verschiedene Sachen machen das eine ist das administrative das war schon angefangen haben also die noch dazu zu sagen und um wie wir heute natürlich eine Einführungsveranstaltung in dem Sinne machen mir gut vorstellen und der Vorlesung generell allgemein wird und wir schauen uns mal so was motivieren an warum sind solche semantischen Technologie der das Ganze auch als überhaupt notwendig was bringt uns das ganze damit vom also quasi wozu das ganze gutes was für das beste machen die Veranstaltung
selbst mach ich eigentlich nicht Art und Weise schon seit geraumer Zeit das heißt das 1. Mal kann habe ich mit dem Semantik der immer in der Lehre 2005 2006 damals noch an der Friedrich-Schiller-Universität Jena in Berührung abwarten Seminar gehalten die Inhalte war natürlich noch wesentlich geringer weil das Angebot wächst ja auch erst seit einiger Zeit das ist noch gar nicht so alt werden Sie sehen und das eine das Schöne ist der Vorlesung sie ändert sich auch von Jahr zu Jahr deutlich weil immer neue Sachen dazukommen ist natürlich auch den Nachteil weil der für mich ich muss natürlich mehr vorbereiten ich muss dann von Jahr zu Jahr mehr März aber ist natürlich auch vielleicht interessanter als ohne total allein gestoppte 25 Jahre alte Mathematik Vorlesung ist gar nicht mehr man müsse nicht von vorne mit dabei manche Sachen sind aber noch überhaupt nicht mehr richtig weil man sich anders entschieden ab oder gesehen hat dass es jetzt auch nicht der richtige Weg gewesen aber man hat zumindest das Gefühl dabei zu sein die 1. Veranstaltung am Hasso-Plattner-Institut etliche 2008 2009 noch als Gast Prozent gehalten
dann die 1. richtige als sie nämlich dort wo 2009 2010 2010
2011 ist mit anderen Logo damit man die Vorlesung als auch auseinanderhalten kann also es gibt dazu auch Blogs und zahlreiche sagte sich wieso so das Gefühl haben zu welchem
Jahrgang wird jetzt das was sich gerade gesehen aber das war vom letzten Jahr und dieses Jahr
haben und auch für das kommende entschieden hat sich das Wort das des Programm von wertvoll und das hier jetzt unser hier Logo für die vor diejenigen
die schon mal gesehen haben muss ich mir auch vorstellen Arbeit sagt ich bin mir sicher wies deutscher mit einer mittlerweile relativ großen Forschungsgruppe ab die wir machen alles was irgendwie mit Semantik zu tun hat also Semantik der Daten oder ist alles was mit Wissensrepräsentation zu tun hat also und oder man das und die Art ursprünglich komme ich aus Suchmaschinen Bereich also vom Menschen mit viel machen auch noch das ganze dann im Bereich Multimedia vielleicht so und schon einer der Multimedia Analyse Seminare gesehen und so schön etwa wird man wohl dieser ganze Kram wird natürlich auch noch mit dazu und und das Ganze mit viel bringen beziehungsweise Oberfläche der zu gestalten das heißt und vom 1. bis heute zwischen sind ebenfalls auf Schwerpunkte die unserer Forschungsgruppe hier beschrieben weggelaufen sind wir sind in einigen Forschungsprojekten ein interessantes dass ich schon seit Jahren oder dass wir schon seit Jahren mit das ist das Restaurant Projekt bei dem es um sich vielleicht um Vorlesungs Aufzeichnungen nicht über weiter wird aus nur dass die aus der ganzen Welt stammen und durchsuchbar sind jetzt mittlerweile man auch semantisch durchsuchbar und wir sind im gleichen Umfeld es geht um semantische Analyse semantisches suchen Multimedia-Daten da auch wieder Gruppen ist dieses Projekt kommt oder jetzt auch mit der Informations und Hannover was auch ein Portal für ihre Videoinhalte die man dann semantisch durch zu viel selbst die Gruppe
mit Hauptgebäude 1. Etage zu dieser Runde des aber 37 bis H 1 40 der noch nie geschafft alle zusammen auf einem Bild zu bekommen dass das Bild mit dem als Mitarbeiter und ein auch wieder nicht mehr da ist und wir suchen natürlich ständig irgendwelche studentischen Hilfskräfte das heißt weil sie im Zuge der Vorlesung feststellen semantische Technologien das ist was ich da möchte man bisschen weitermachen können Sie natürlich gerne mal bei uns vorbei kommen und fragen suchen ständig Hilfskräfte in diesem Bereich und die bieten dazu natürlich auch der Arbeit an der und das auf jeden Fall und gut wenn es noch mit
von der Partie in gut und oder so werde richtig zu
euch und auch auf die Übung kommt hier noch mal kurz die Daten zusammengestellt also Vorlesung Dienstag erzeugt von 13 Uhr 30 bis 15 Uhr und die Übungen dann morgen Mittwoch 13 Uhr 15 Uhr aber nicht nur soll sondern nahmen die 52 und das und Emailadressen und in Kontakt kommen wollen oder kommen so einfach vorbei auf das ist auch bei uns im Büro wie kann man sich
noch vor mir ist gibt eine Website mit einer und sehr gut oder gut das findet man Informationen des hat haben uns gedacht ist es auch immer komplizierten ist tot oder ist das alles drin haben und dann sieht nicht so aus für wollen einfach Block das geht schneller das heißt das lockt mit einer etwas kürzeren URL sehen sieht unter unterschreiben war alles relevant und kurzfristig auch was welche Bedeutung für die Vorlesung oder für die mit rein das 1. diese oder sollten sie drinnen folgende sind dann auch immer Links zu den jeweiligen Hand-out heute als auch der 5 Minuten vor der Vorlesung dazu kommen quasi das aktuelle dort nicht nur das das was sondern auch zu den 2. Teil und ob sie werden hochzuladen das heißt es ist immer ganz kurz vor der Vorlesung aktuell dazu noch eine weitere sich das diesen out würden und natürlich sehr freuen wenn wir davon auch erfahren würden dann aber die Chance zu korrigieren und spätere Generationen werden dann nicht immer sollte als und bestreitet dies können wir das dann korrigieren Rechtschreibfehler sind dann ganz schnell inhaltliche Fehler sind können was ausdiskutieren auf jeden Fall kann es dann auch passieren dass die dort muss sich auch an dieser Stelle sagen die wir EU hochladen gefunden worden ist quasi noch mal neue hochladen ohne das heißt sie mit 3 und verlassen sich nicht auf das älteste dort wo das heruntergeladen haben wir sagen dass aber normalerweise nur dafür das Block gefunden haben was ersetzen was auf den können Sie dann die richtige Version und ok gut was machen wir als
Nächstes mit einer kurzen Einführung die wo heute zusammen gestalten werden können und diesem an Basisarchitektur mal so das als Technologien auf die dieses ominöses Semantik was das Wort kennenlernen dann der Aufbau und es ganz wichtiger Bestandteil wenn wir diese Basis sprachen wir brauchen kennengelernt haben ist dass wir uns alle Gedanken darüber machen wie kann ich eigentlich ist wissen und die Bedeutung von Wissen in irgendeiner Art und Weise formale ausdrücken das heißt und um Wissensrepräsentation kann man das so so was Ähnliches wie sich die Datenstrukturen nur dass man noch immer Akten kann nicht man kann tatsächlich auch noch Logik mit einem und Wissen und kann damit arbeiten neues Wissen aus generieren neues Wissen erschließen das kann man mit normalen Datenstrukturen nicht das Abkommen nicht auch die Logik mit unter der ganz am Ende des 2. 3 Vorlesungen sei werden wir uns dann noch mal anschauen was kann nicht alles mit den Sachen über die kennengelernt haben machen das ist wie sie die eigentlichen Anwendungen aus die man hier nur auf etwa Semantik tatsächlich was das ganze
wird heute loszuwerden so historisch mal gucken wie hat sich das Werk entwickelt großen jetzt genau die Knackpunkte das heißt wo fängt es an zu knirschen aufgrund der Größe der erreicht haben und die kompliziertestes mit Information über drin ist zurechtzukommen Bush durch Google tatsächlich auch an seine Grenzen und Bob konnte ist jetzt die Richtung Semantik das heißt wenn die Bedeutung der Information hat sich auch noch explizit gemacht wird oder schlossen wir werden dass wir uns als erstes kommen später die
ganzen Basistechnologien also ab nächster Woche dann kommt da ist natürlich dabei eine kurze Wiederholung von XML und SMS klimatisch gesagt wird morgen dann anstelle der vom stattfinden wird auch von Aldi und Markus durchgeführt werden nächste Woche weitermachen mit der 1. Form der Wissensrepräsentation das so so genannte ist so aus dass wird werden wir kennen lernt man einfach Aussagen zusammenbasteln und dazu gehört auch das Klima wird also Beschreibungssprache mit den nicht Ontologien aufbauen kann dir noch nicht viel wissen tragen die Fall aber ganz und also nach Semantik angesiedelt hat jetzt dann wenn uns anschauen die kriege ich diese ganzen Sachen jetzt hat sie sich mit das World Wide Web hinreichende werde es ist natürlich nicht Teil dessen was man normalerweise und sind beispielsweise zu Mikroformate davon und vielleicht voraus gehört von Marco Format vielleicht haben Sie auch schon was uns Klima dort dort wird aber es gibt auch die wird sich dann hat aber das ist ja der hat Attributen drin und wird mit dem man das Ganze dann aus hat er sehr leicht wieder herausholen kann das wir bei uns anschauen also bekomme ich diese kleine Semantik oder das der ein und und das dann auch wieder auf und wartet das ist Abfragesprache geboren zur zum noch anschauen dieser Namen SQL angeblich aber das ganze reichten nicht aus die dann auch
herausfinden warum das Ganze nicht ausreicht und dann die Logik 3 das heißt wir müssen uns etwas Ausdrucksstärke komplexere Wissensrepräsentation anschauen das als allererstes kleinen Exkurs machen der Begriff der Ontologie also in unserem Sinne der Wissensrepräsentation relativ alt stammt aus der Philosophie des betreibt und von dort diese Disziplin seit über 2000 Jahren des sollte natürlich wissen wo das ganze geschichtlicher kommt was die Philosophen damit machen was sich die Informatiker quasi davon geklaut haben oder annektiert haben und jetzt im Bereich der semantischen Technologien damit anstatt das ganze basiert ursprünglich natürlich auf der Aussagen Logik und der Prädikatenlogik aus russischen deutsche und fordern deutsche deshalb werden wir das hier an dieser Stelle auch noch mal wiederholen nicht genau die Bereiche die wir eigentlich später dann auch brauchen ich gehe davon aus dass sie alle im Rahmen ihres des Grundstudiums mal Logik Vorlesung ab oder Logik zumindest im Rahmen der Informatik Grundausbildung genossen haben werden daher auf spezielle Techniken nicht auf das automatische schließen so Resolutionstext mit dem Tableau Verfahren abziehen damit das alles noch mal wieder und Sie das parat haben für eine neue Form der Logik die sich noch nicht können für die sogenannte Beschreibungslogiken englischen das coachen Lodz dass es sich nur eine logisch dass viele verschiedene das hat mir zwar laut wächst und die normalerweise derart zu geben die der Wissensrepräsentation zu beschreiben Semantik der und die sind so ein bisschen von ausdrucksstärker angelegt zwischen der Prädikatenlogik der Aussagen logisch und Vereinen wie das Beste aus beiden Welten das heißt es gerade noch berechenbar aber trotzdem ausdrucksstark gut wenn wir also dafür die theoretischen Grundlagen gelegt haben ein Stückchen weiter unseren Wissensrepräsentation komplexeren Sprachen nicht Verfahrens man was Semantik steht es was also noch im letzten Kapitel kennen kennengelernt hatten und machen dann weiter mit Powell das ist quasi die Semantik der Sprache die Beschreibungslogiken eine ganz bestimmte beschreiben Slubice abbildet und noch anschauen wie sieht das aus das noch komplexer wird nicht Regeln mit der zunehmenden wird die mit der denn auch im Bereich der Logik und der Künstlichen Intelligenz gearbeitet das genauso das Verbrechen quasi oder das Holz dann auch gewesen sein mit den theoretischen größter wie
die Anwendungen Rahmen und schauen uns an ob ich kann ich Wissensrepräsentation tatsächlich jetzt aufbauen nicht Software nicht einfach nur so Klimaänderungen oder quasi allein am Schreibtisch und ohne jegliches Verfahren oder Grundlage entwickelte zu natürlich auch hier Methodologie im Bereich des und forderte mir wie ich jetzt hier geben kann und großmaßstäbliche industriellen Bereich Wissensrepräsentationen mit vielen zusammen dann auch sehr komplex Aufbau dass es einen Bereich den uns anschauen der bei den Applikationen 2. Bereich 2 bisher vom Text wir alle zu der Wissensrepräsentation kommen und das ganz wichtiger Schritt dass sich Text quasi herausfinden was bedeuten denn die einzelnen herum die ich hier aber was steht dafür für eine semantische gibt kann man das dahinter und das dieses quasi Erkennen von semantischen Entität dieser Prozess wird den die Titel das schauen und sind bereit und ein ganz wichtiger Bereich wollte auch schon mal mit Anfang ist der Bereich des später das ist quasi so das oder der Vertreter des Semantik der jetzt aktuell werden der zu finden ist das sind also quasi eigentlich vormals strukturierte öffentlich verfügbare Daten die jetzt über erfasst einfache semantische Beschreibungssprache kodiert sind und über sehr einfach Mechanismen zu greifbar sind und untereinander auf verlinkt sind mit dem kann man wunderbar arbeiten dazu gibt spezielle Art ist uns mal kucken will man also diese Daten miteinander kombiniert da sie sehr schnell und auf einfache Art und Weise Sommer statt ausbauen Wissensrepräsentation der der Daten müssen natürlich in der Art und Weise auch assistiert werden das heißt es in der Datenbank geschrieben werden wir das normale sollte man relationale Datenbanken Objektrelationale Datenbanken für diesen Zweck nur bedingt geeignet sind es gibt es spezielle Adelstätter bis zu handelt für Restaurants uns anschauen und überlegen warum sind besonders gut geeignet ist es gut 3 was ist schlecht daran wie funktioniert das Ganze dann noch 2 weitere Anwendungen rein einmal in diesem Band Versuche was bedeutet dass für das von Menschen mit viel wenn ich jetzt nicht nur quasi nach dem Text suchen kann sondern nach der Bedeutung des Textes und was kann ich damit alles machen und dann auch noch die kann ich dann auch Semantik im Multimediabereich bin ich keine Texte haben bekanntlich da die Semantik quasi aus den Bilder aus dem aus Videos aus das ist der letzte Teil der Vorlesung über und das machen hatte das sind so die einzelnen Teilgebiete und den Mund nächsten 14 Wochen beim Unterhalt dieses Bild sie
eigenständig Wiedersehen dass es die oder der Semantik der Architektur stapeln des quasi aufeinander aufbauende unterschiedlichste Technologie die jetzt zur Wissens Repräsentation Semantik aufgelistet sind brauchen Opposition nicht verstehen wird das dann Stück für Stück jedes Mal durch durchgeben von unten nach oben weil jeweils in dem Bereich von gerade braucht es gibt natürlich
auch Literatur der durch die man sich dazu angucken kann Teile der Vorlesungen Folgen des Semantic Web Grundlagen Buch hier von Pascal jetzt allerdings am sind einige Dinge die wir machen jetzt schon darüber hinaus und und dabei der 2. Teil der Vorlesung dazu gibt es eigentlich noch ein richtiges Buch beziehungsweise sind immer noch Einzelteile zu den ich dann Hinweise geben wußte das Buch welches auf Band über der 9. ist eigentlich genau dasselbe Buch nur dass es in dem Beschluss und 2 Jahre neuer das heißt es dort geht das Ganze schon bisschen weiter sodass das ausführlicher als das obere Semantik der Buch beide sind eigentlich auch in ausreichender Zahl der vor beziehungsweise das deutsche Sprache Semantic Web Buch das auch komplett als Volltext der das unter dem Material auch für das ist sich das anschauen können ja zur Kontrolle chi mir da auch 20 herausgesucht schon bisschen dass unsere unter deutschen Ingenieure und das obere und wurde und ich kann nicht mit und Lublin Wissensrepräsentation arbeiten gibt es noch ein Buch im Bereich der dass es relativ neu von 2000 gilt dass es auch als Volltext wird verfügbar das heißt es müssen sich auch nicht auf von der sind dann noch auf der letzten Seite unsere 2 3
Materialien Quellen bei denen sie sich alles erfahren das Block die Webseite von ganz unten und wenn der weil sie Material für sie extra für die Vorlesung zusammenstellen also eine liegen sondern dass es war so schön oder so Marketingtool gerne Webseiten Bibliografie und andere Sachen verwalten und da gibt es ein spezielles der da sie sämtliche Materialien zu einer jeweils Vorlesung dann zusammengefasst werden dazu für dieses der dort sind immer die entsprechenden Text oder so dass an kommen sie auf den Materialien zur Vorlesung des weiteren sind laut natürlich auch immer wieder links Brindisi wenn sie das ganze Rechner ankucken anklicken können und dann kommen Sie zu den entsprechenden Materialien die dann noch irgendwie interessant gut dass es quasi das administrative rund um die Vorlesung die von ihrer Seite
zum administrativen Teil Schumacher wenig oder falls stehen und das Ganze ist noch auf dann machen wir weiter direkt mit dem 1. inhaltlichen
Teile des richtige der nämlich mit der
Einführung des an der Erste Vorlesung und zwar hatten wir gesagt wir wollen uns Semantik aus einer historischen Perspektive das heißt es irgendwo
ganz am Anfang Mai an und über die und gar nicht erst mit dem Internet eigentlich an die hat sich das ganze entwickelt zum wird dann weiter zum 2 0 und wo quasi sind die Grenzen der eigentlich und kann man über diese Grenzen kommt gut also ganz am
Anfang steht das des von kümmern sind nicht genauer vielleicht die Fernsehserie aus der genau dieses wird das Internet quasi ausgenommen ist wenn nicht fragen tun das Internet das schon relativ alle müssen sie alle vielleicht aus welchen Widerstand das Internet weil es ja gut sein dass umgekehrt waren wurden die 1. Rechner im Internet zusammengeschaltet sagte stark 69 also nach 3 am
29. Januar 1969 dieses Auto nicht Internet ist es auch an unter diese 3 aber merklich rausgeholt sollte man sich mal angucken Delikte Licklider der Wähler und der Roberts haben sehr natürlich recht also genau formuliert die Ursprünge des Internets den sogar ein Stück weiter zurück manche sagen dass irgendwann einen so zur 2. Sputnik-Schock 1957 Sputnik 1 der 1. Satellit der Sowjetunion damit hat das damit dass die Sowjetunion was im Weltraum geschossen hat sind natürlich aber wiederum möchte sich wieder sieht das irgendwie Forschungsfeld mit der 10. Hintertreffen geraten ist Gründe daraufhin die sogenannte aber auch die Advanced Research baute Chance dass es eine Forschungsförderungseinrichtungen die Forschungsgelder verteilt die Wirtschaft an die Universitäten die geforderte sowie dieser Forschungsförderung ausgelöst durch den 2. mit Wahlsieg kann man auch auf die Idee dass wir vielleicht ganz interessant der Computer gab es schon Ende der fünfziger Anfang der sechziger Jahre wenn die Daten miteinander austauschen war ziemlich und wird die aber nur auch für man das macht sollte das auch natürlich in irgendeiner Art und Weise möglichst störungssicher ausfallsicher sein man hatte damals in den sechziger Jahren einen sehr sehr großes Problem da gab es jetzt nicht nur PCs oder nicht nur mehr sondern quasi jeder eingesetzte Rechner waren sich fast Spezialanfertigungen hat irgendwie sein eigenes Betriebssystem hatte seine eigene Binärdarstellung von irgendwelchen großen Zahl muss alles Mögliche und übersetzt zwischen allen separat Interface schaffen und das hat man sich Gedanken gemacht wie könnte man daher vereinheitlichtes mit Network der Netzwerk schaffen mit vereinheitlichten Schnittstellen und das haben wir diese 3 Jahren allen voran der Mitglieder der war der 1. Direktor des so genannten vom Englischen Prozess der Tschüss Office der aber ins Leben gerufen und der hat zusammen mit Robert Shiller nachgefolgt des 1966 der Arbeit geschrieben der Computer 1. Communications jeweils sagte der Computer als Kommunikationsmittel und hat dann schon sehr sehr viel Text vorweggenommen quasi was das der oder das Netz uns heute ermöglicht dass das nicht nur so was ist wie die bisherigen Massenmedien bei dem man Informationen vorgesetzt bekommt man dann konsumiert sondern dass man interaktiv die Möglichkeit hat Informationen dort aber tatsächlich auch einzustellen darauf zu reagieren und dann tatsächlich Interaktion mit Partizipation entstehen kann also das schon Ende der sechziger Jahre gut das Netz hat sich seit der relativ erst etwas zögernd und dann sehr schnell
ausgebreitet als sie sie hier hat gute Jahre gedauert USA mal mehr als eine Handvoll Rechner tatsächlich stand das Problem und das am Anfang relativ langsam Gegenwarts einen natürlich Rechner sind teuer Kommunikationsverbindungen für Rechner sind ebenfalls sehr sehr teuer aber es hat natürlich noch einen anderen Grund warum das damals noch keine Popularität gewinnen konnte vielleicht erinnern sich noch einige von ihnen ist gab man solche
Dinge das nannte man in einem solchen kann hat man die Möglichkeit wenn man also nichts anderes hat kein Browser keine grafische Benutzeroberfläche nur ein Termin kann man natürlich trotzdem auch das Netzwerk nutzen und kann Information auf anderen Rechnern zugreifen kein Problem aber ok funktioniert das dann auf müssen erst mal einen fremden Rechner sind die wir uns wie man so schön sagt von Tieren als Turing Bordcomputer dort wenn wir Glück haben können wir einen Teil des Systems gern das heißt können schauen was ist dort tatsächlich ein Informationen vor an und wenn ich dann nach und nach auch mal eine Datei gefunden habe die mich interessiert dann kann nicht über das Netz zum Herunterladen und dann bei mir und hat sie nicht angekommen ist dann kann ich dir anschauen aber sie können sich vorstellen dass natürlich dieser Art des Informationszugriff seines andererseits nutzerfreundlich das heißt auch wenn das Ganze so Ende der sechziger und siebziger Jahren möglich war also meine Mutter werden ja auf die die Idee gekommen und der Art und Weise so im Netz zu sehr auf das heißt es ist wieder benutzerfreundlich auch natürlich dafür Expertenwissen dann die ganzen Programme kennen muss den bedienen muss man muss das Protokoll kennen muss wissen was heißt es System ist und wenn man tatsächlich einmal nach Informationen sucht das heißt nach Inhalt wird ist natürlich sehr kompliziert weil man muss und nur rein schauen zu können die Sachen tatsächlich erst mal herunterladen und das macht Standard für mich sehr kompliziert die 1. Erleichterung kann dann
1990 Ende der achtziger und neunziger Jahre mit dem World Wide Web quasi wie sie es heute schon kennt den oberen sicherlich gesehen Kindern das den unteren geholfen hat den sieht nicht auf den Druck der KI oder ist mittlerweile auch von pensioniert also ist und hält sich ein bisschen so Hintergrund und an das Ganze entstanden das wär das kennen Sie auch als die Geschichte als quasi Dokumenten Verwaltungssystem größten europäischen Kernforschungszentrum CERN gehen als 1. intern und dann hat man es auf die Idee kommen das kann nicht mehr Intranet nutzen sondern natürlich auch über das Internet die weltweit und dann Anfang der 90er Jahre hat ist ein sehr schnell verbreiten interessante Geschichte die auch von Kindern ist immer wieder gern erzählt wird man gefragt wird was war jetzt eigentlich der Grund warum dann dann tatsächlich dieses bald genutzt hat oder was war die Killerapplikationen weiß man dass die Killer-Applikation war die 1. das war das CERN Telefonbuch also eigentlich was dafür gedacht Dokumente zu verwalten und hat der Fall wenn kennen diese riesengroßen Teilchenphysik Experiment jeder durchgeführt da sind normalerweise Hunderte von von Forschern mit Beteiligten die zusammen ein Dokument schreiben oder man quasi also diese doch könnten diese Experimente verbreiten will braucht man schon ein gutes ist das dann in der Lage ist diese Dokumente die dazugehören zusammenzuführen zuordnen zu strukturieren zu organisieren das hat man mit Hilfe eines Hypertext Systems versucht und dann wurde aber nur zögerlich angenommen von Wissenschaftlern aber was die tolle fanden war dass man damit sehr sehr schnell die Telefonnummer von den Kollegen aus konnte damit hat sich dann dass wir tatsächlich auch durchgesetzt gut was war das besonderer kennen Sie auch das
besondere sieht man jeden Tag das sind längst in diesem Netzwerk das Netzwerk ist jetzt nicht mehr quasi Rechner zentriert vormals über das haben sondern Dokumenten sind das heißt Grund Paradigma lässt sich an auf einem Dokument ich kann das Dokument Browser antworten wenn ich einen neuen Dokument gehen möchte täglich einfach einen an zu einem Dokument das mit dem vorliegenden Dokumenten Browser verbunden ist es ist ganz einfach das versteht auch oder hat auch schon sehr schnell meine Mutter Verstand und auf diesen Lage als Index zu saßen weil man eben nur noch von einem zum nächsten sich entlang die grundlegende Idee die dahinter steckt dieses Hypertext oder heiter an der System ist eigentlich auch schon viel viel älter als man eigentlich meinen sollte also das Prinzip
letztendlich das sich Dokumente untereinander Widerstand das haben schon die 1. so genannten Enzyklopädisten zu Zeiten der Aufklärung weist die Aufklärung der stattgefunden hat 18. Jahrhundert im 18. Jahrhundert sein für die Aufklärung genau richtig erging es eigentlich darum dass ich philosophische und und weltanschaulich Ansicht dass merken möchte da dann die Leute angefangen quasi sich aus dem sie die die also ist natürlich immer recht sein kann man drastisches Vokabular verwendet nämlich sie wollten sich aus der Knechtschaft der althergebrachten Traditionen und der Kirche lösen sondern nur noch sich Verstand und den Regeln des Verstandes unterwerfen und quasi die Wissenschaft im Vordergrund stehen hatte das war so quasi wie sie einst Aktionen Wissenschaft von der Kirche von zur Zeit der Aufklärung statt und zwar in Führung den Aufklärer der französischen den die der und Schaumpartys und er die beiden haben sich nämlich nicht zur Aufgabe gesetzt sie wollten das gesamte Wissen der Welt zusammengetragen in einer Enzyklopädie natürlich nicht nur die 2 zusammen insgesamt hatten Mitarbeiterstab von über 140 für die dieser Enzyklopädie gearbeitet haben und damit letztendlich haben Sie dann zwischen den Jahren 1750 und 1780 als 30-Jähriger Arbeit 35 Wert jedes Werk knapp tausend Seiten insgesamt 70 Tausend Artikel haben Sie da zusammengetragen der Wikipedia müssen Sie sich vorstellen als in Buchform 16 Länder allein Text Reste eines nur ab Bildungswerke mit Tausenden von Kupferstichen irrsinnig aufwendig und wenn man also zu Enzyklopädie anfängt kommt natürlich auch das Problem man möchte das ganze Wissen der Welt beschreiben möchte sich aber eigentlich nicht wiederholen weil es war ja nicht mal überall verteilt in den Büchern stehen was beispielsweise einen Rat ist so was auch immer das heißt das benutzt man einfach Querverweise und zu sagen und man wissen möchte was jetzt das bedeutet was ich geschrieben habe dann Cook auf dem Band 2 auf Seite 234 bei den Artikel nach der das beschrieben also diese Querverweise über das aus dem Hypertext Handy stammen eigentlich aus diesen Zyklus Bereich wurden da damals entsprechend schon Probleme bei der ganzen Sache 35 Folgebände also so groß und 14 Kilo wiegt einer der großen Ausgabe ist ein bisschen unhandlich heutzutage Hypertext innerhalb des einfachen man hat sich natürlich auch schon in der Zeit Gedanken gemacht und Benutzer das ist es also da wurde
beispielsweise hier schon 100 Jahre zuvor das so genannte dieser Art gefunden das weiß ich Gespenstes gibt so was tatsächlich sollte sie mal nach Hannover verschlagen insbesondere die herzoglichen Bibliothek von Wolfenbüttel eine der bekanntesten Bibliotheken in Deutschland überhaupt da können Sie ein solches dieser Art von einer hatte man so die Möglichkeit aufgeschlagen größere Bücher hier abzulegen und dann auch so liegen zu lassen und dann als Buch zu springen nicht wie das Hypertext möglich war allerdings in Sachen Usability war das natürlich auch noch nicht so weit fortgeschritten dass es sich bereit durchsetzen werden weiter nächster Schritt das ganze werden die in der gleichen Art und
Weise zumindest zu elektrische zieren kam schon hier Rahmen oder kurz nach dem Zweiten Weltkrieg gewann Bush vielleicht kannst gehört auch eine Vorlesung das ist einer der Lage Direktor in einen der USA oder in einer Behörde die beispielsweise also die dort US und getriebene Forschung im Zweiten Weltkrieg betrieben hat also der war auch als verantwortlich oder unter seine Verantwortlichkeit wurde auch das Manhattan-Projekt dann letztendlich ins Leben gerufen dann jemand anderen geführten von Dani weiter übernommen Manhattan-Projekt das wissen Sie sicherlich oder uns schon mal gehört der Dienst an die Entwicklung der Atombombe und der hat auch Gedanken gemacht wie man jetzt wissen wir nach Art und Weise miteinander verknüpfen und konsumieren könnte die sogar noch einen Schritt weiter gesagt eigentlich müssten Sie das mal man oder den Artikel durchlesen sehen sich schön Illustrationen des und Forscher der dann oben auf dem Kopf eine Kamera mit einem Auge und alles wird mit 30 also erleben was Sie lesen und so und das kann man dann über diesen schönen Gruß und Elektro mechanisch gesteuerten stand am Ende dann wieder abberufen dass man quasi als verlängertes Gedächtnis im Sinne eines Hypertext oder halt es ist nicht wissen was als aufgesammelt hat dann wieder ab und kann also das war schon 19 45 natürlich ein in dem Sinne weil man es nicht konstruiert hat aber hier leisten eines Informanten Skizze gemacht wie sowas aussehen könnte so hat man sich eben damals vor aber die Frage warum sich das kann tatsächlich richtig und
auch im großen Stil durchsetzen konnte ich natürlich irgendwie an der Usability das heißt an der Gestaltung der Benutzeroberfläche werden einer von ihnen auf der einen solchen ein textbasierten Browser ist von 1900 93 schon ein bisschen älter auf man so was genau dann allein mit der Tastatur zu begehen also ganz tolle Sache aber letztendlich ist es ein schon ein Jahr später 94 gab es den 1.
Browser und dann konnte man das Ganze mit der Maus bedienen ganz natürlich kein Zurück mehr was das angeht und auch heute noch immer noch nicht mal aus machen wir das natürlich nur
mit dem Finger auf dem funktioniert das Wunder iPad und andere mobile Geräte sind dafür verantwortlich dass quasi das Wachstum im Internet
immer weiter geht also es gibt ja diese Internet und es aus und dann wird geguckt wie viele Rechner sind jetzt tatsächlich am Internet angeschlossen mit einer statischen IP Adresse und Antworten geben wenn ich der Frage das wird eigentlich nicht mehr zweimal im Jahr großmaßstäbig durchgeführt seit vielen Jahren mittlerweile sind schon fast eine Milliarde angelangt also der letzte letztes Jahr in das durchgeführt worden hier im Juli diesen Jahres dass man bei 900 Ionen Rechner angekommen gerne eine richtige IP-Adresse sind viele Geräte letztendlich in Netz 2. Teil alle diverse IP Adressen beziehungsweise die eines dieser oder die Service Provider die an den heimischen Paul Einheit Adressen sich ständig weiter geben und die wir alle halt nutzen das die aufgebraucht sind die IP Adressen oder schon aufgebraucht sind mit etwa viereinhalb vor 6 das wissen Sie das ist aber nicht immer zur vor gut wird hat sich aber seit das der
natürlich auch einiges getan und geändert hauptsächlich an den Inhalten werden früher noch alles diese ausgerichtet war also in Richtung Massenmedium das heißt es gab einige kommerzielle Informations Provider muss man sagen jetzt Inhalte ins Netz gestellt haben weil die das nötige Expertenwissen hatten Webseiten 30 zu bauen und das Ganze auch teuer war und es kann sehr sehr viele Leute das gelesen haben ist gegangen das können Sie auch in Richtung jeder kann jetzt mit einer geeigneten Werkzeuge auf sehr sehr einfache Art und Weise nachhaltig ins Netz stellen mit Hilfe von Blocks mit Hilfe von solchen Network Plattformen einen möglichen denen die sich und jeder ist jetzt in der Lage tatsächlich waren nicht nur Informationen zu konsumieren sondern auch zu produzieren und interaktive an den ganzen teilzuhaben das ganze wurde
von 3 Jahren dann als Revolution und unter dem Stichwort 2 0 propagiert wobei das Online-Marketing Book der Begriff die Technologie die stecken also wie man das machen kann mit JavaScript und so dass ein ganzes Stück älter gewesen aber man kann erst zur Mitte der 2000 Jahre alte 2005 so was auf den der dass das doch etwas Neues ist dass das Gegenrevolution aus ok so viel zum Ist-Zustand das Problem erst dann Zustand
ganz ausgelotet das heißt wir wissen noch gar nicht wie jetzt eigentlich zu finden ist was wissen wollen ist wo sind jetzt genau die Grenzen und die hatten das sich oder arbeitet man genau an diesem 1. Frage was das findet man was
Netz also das ist ein bisschen so als würde man wenn man bestimmte Informationen sucht je nach Heuhaufen suchen wollen wir wissen die Lösung heißt heute normalerweise Google das
heißt alles was Google nicht gibt gibt es eigentlich nicht und wenn dann gebe ich irgendwo bei Google beziehungsweise allein schon in einem Browser in der Zeit der ich normalerweise die nur ein ist dann schon komplett mit Google verbunden und da kann ich dann direkt an schon Ergebnisse zum einen Suchbegriff sind und deshalb haben wir uns auf eine ganz bestimmte Art und Weise Informationen der zu suchen und zu finden und aber werden auf der Vorlesung sehen das ist vielleicht nicht unbedingt die zuverlässigste die sicherste und die einzige Art und Weise wie man das macht das generelle Problemen bei der Informationssuche der mit den Worten von Douglas Adams gesprochen das wäre es natürlich
groß ist ziemlich groß ist wirklich verdankt groß letztendlich und keiner weiß eigentlich großes tatsächlich ist weil man hat aufgehört die so richtig zu C wenn sie nach einen suchen wie groß das wäre es wenn sie
unterschiedlich sein kann leider nicht mehr so ganz toll wesentlich nicht wird das von oben nach unten erklärte die Zahlen sind relativ alt war die Suchmaschinenhersteller irgendwann mal aufgehört haben miteinander zu konkurrieren zu sagen wie groß der Index und zwar hat man hier schon 2005 aufgehört als ungefähr 25 Milliarden Dokumente den Suchmaschinen nächsten drinnen waren da damals Yahoo und Google also quasi den Ball zwischen sich und gespielt und man an aufgehört bei gewusst hat dass sind 2 Dokumente drin aber das Problem ist der Dokumente drin sind ist Sport ist auch das heißt gebeten erkennen und alles wird natürlich unglaublich schwer bei diesen Größen aus dann wurde 2008 veröffentlicht das der Google Web forderte er ständig dabei ist Webseiten zu suchen und also für den Index aufzubereiten jetzt mittlerweile hoch 12 dass es an den amerikanischen Worten Trillian also eigentlich eine Billion in unseren deutschen Sprachraum Dokumente erfasst hätte die natürlich jetzt nicht alle Index bei der wiederum viele Doubletten dabei ist nicht unbedingt alles richtig und als Google dann vor 2 Jahren den Suchindex umgestellt hat auf einen neuen Suchindex auf diesen Kauf Index dann wurde mit den Zahlen bekanntgemacht nicht mehr wie viele Einträge der Index hat sondern die große denn tatsächlich ist der hat 100 Millionen Gigabyte und bei 100 Millionen Gigabyte es auch uns klar die wird bei jeder Rechner haben in diesem Future-Store für den und Gigabyte große Speicher drin sind aber da passt das natürlich auch noch lange nicht ein sondern da muss man sich dann wirklich was Besonderes einstellen lassen um auf diese Größenordnungen effizient zugreifen zu können dazu müssen auch noch wissen nicht alles was tatsächlich existiert ist auch tatsächlich bei Google vorhandenen irgendwie dynamischen Webseiten gelagert sind die keine Zeit haben oder die Zugriffsrestriktionen unterliegen das alles ist natürlich nicht letztendlich Suchindex einer solchen großen Suchmaschine verfügbar das heißt dass es eigentlich noch ganzes Stück größer auch dazu gab es mal Zahl die mittlerweile alle nicht mehr gelten dass es schon über 10 Jahre alter hat man gesagt dass stark als diese Bereiche die nicht Suchmaschinen sind über 500 Mal größer als das normale aber das geht mittlerweile nicht mehr ich habe nur als ist interessiert mit einem aber jetzt schon wo rede ist das deshalb schon wieder ein
Stückchen größer geworden denn jede Minute 6. ganzes Stück weiter ich hatte so schön Infografik gefunden die
stammt jetzt aus dem Juni das heißt es auch nicht mehr ganz aktuell und in der steht quasi dringend um die Interessen der pro Minute wächst also pro Minute 217 neue mobile mobile Nutzer pro Minute gesteht 48 Stunden mittlerweile sind fast 70 Stunden Video-Upload YouTube 204 Millionen Emails pro Minute 2 Milliarden Suchanfragen an Google waren Facebook schweres 684 Tausend dann werden pro Minute 272 Tausend Dollar ausgegeben dass es auch schön für die Wirtschaft entweder werden über 100 Tausend Tickets gesendet bei der werden 47 Tausend Hz aus dem Ärzte und geladen waren in Facebook werden pro Minute 34 Tausend leicht vergeben bald Handel 27 Tausend Blockhaus veröffentlicht bei stark an 3 Tausend 600 Fotos hochgeladen häufiger auf über 3 Tausend Futter Fotos hochgeladen und 2000 Leute müssen ständig und Minute war vor Square sagen wo wo sie jetzt gerade sind als das einige Zeit die uns zu denken geben sollten weil auch die ständig wachsende und selbst damit wird noch nicht auf hatte die Informationsflut von wird noch immer größer denn das jetzt erst mal nur wir die Daten produzieren das kommt ja noch jemand zu nämlich die das heißt in diesem Internet auf längst
das mittlerweile auch enorme Größe erreicht hat 2008 hat die zeitweise der Gegner die mit dem Internet verbunden sind also Haushaltsgeräte Gebrauchsgegenstände und alles möglich die Anzahl der menschlichen Internetnutzer bereits überschritten und 2020 geht man davon aus dass ungefähr 50 Millionen die weiße 50 Milliarden englischen mit dem Internet verbunden sind und die dann noch anfangen weil sie sich untereinander zu unterhalten
können Sie sich vorstellen dass da natürlich einiges an Informationen zusammenkommen und Suchmaschinen noch einiges zu tun bekommen dann nach Informationen zu und wenn wir uns mal vorstellen wollen wie eine Suchmaschine so die Welt sieht und versteht müssen uns einfach mal eine Webseite angucken einer Sprache die wir nicht verstehen an jemanden der der sind japanische recht gut dann wird das in dieser Zeit relativ wenig sagt relativ wenig herausfinden können aus diesen um die 3 Buchstaben so das mit dem zu tun haben dass das japanische Zeitung was da genau Ausstieg kann ich Ihnen auch nicht sagen aber das Problem mit der Informationen im Web ist Suchmaschine oder weniger auf Informationen darauf zugreifen wollen müssen entscheiden was ist wichtig was es
unwichtig selbst wenn wir tatsächlich verstehen oder begreifen was darunter unter diesen Zeichenketten einen tatsächlichen Text steht müssen immer noch verstehen dass das Ganze erst es unterscheiden kann ganz einfache Sache was ist jetzt davon diesen von Dingen tatsächlich Einkommen rascher also eine Anzeige was es tatsächlich wichtige Informationen und selbst verstehen was das ganze bedeutet müssen wir auch noch wissen wo kommt denn diese Information können mit der überhaupt trauen also die Provenienz der Informationen wie glaubwürdig ist das ganze was gehört jetzt zusammen von diesen Sachen das gehört nicht zu zusammen was ist direkt und dann das was bestärkt sich gegenseitig und als Mensch hat man normalerweise den Vorteil hat ganze Menge Kontext wissen man hat den ganzen Welt wissen und wir haben ja eigentlich schon von Anfang an Seite gelernt haben zu sprechen an die Welt zu begreifen und das haben wir natürlich den Rechner von Anfang an voraus dieses begreifen ist von Bedeutung von Kindesbeinen an gelernt und das ist auch einer der Punkte auf die wirkliche aus möchte in der Vorlesung wir müssen uns nicht mal klar dass wir uns von gegen die mit unserer Sprache zu tun haben wir jetzt Datenstrukturen entwerfen und jetzt quasi eine Adresse die werden und wollen Adresse eines jeden von uns klar da Adresse steht was die einzelnen Bestandteile dieser Adresse bedeuten aber wenn sie quasi diesen Herren oder diese Bezeichnung ich haben nur die Datenstruktur die nackte Datenstruktur sehen und die Bezeichnung der einzelnen Bestandteile des nur 1 1 2 1 3 1 4 ist dann brauchen Sie mehr Informationen strukturelle Information und entscheiden zu können das ist jetzt tatsächlich eine Adresse oder dass es keine Adresse also das zu verstehen was wirklich dahinter ist ist es die Sprache gekoppelt und genau diesen Punkt wo die Sprache an quasi unsere das was werden impliziten dessen voraussetzen Einwohner das auf das müssen wir Maschinen mit denen die das auch versteht was wir drunter verstehen das ist genau der Punkt den ich ausloten wollen und dann am Ende Systeme bauen das Problem das Netz ist das Wetter ist es so schön
heißt es natürlich für den Gebrauch für den Menschen bestimmt gewesen alle Webseiten Sinn aufgebaut aus hat den hat man halt den nachdem kann schön beschreiben was dargestellt werden soll man kann auch beschreiben die Informationen miteinander vernetzt ist aber man kann nicht beschreiben mit hat was diese Information denn nun bedeutet was ist denn nun eine Adresse kann ich mich hat irgendwie nicht aus also die Bedeutung das ist genau das was
bedeutet die Information was aktuell so nicht auszudrücken wenig aktuell sagen man natürlich natürlich können wird seit einigen Jahren schon der ausdrücken was bedeuten dafür an der das Antikörpern die Semantik der Technologien die Nachricht von der seit 2005 das heißt es geht schon aber es hat sich noch nicht so in die Breite quasi ist noch nicht vorgedrungen dass jeder weiß wie das funktioniert was die eigentlichen knapp was die Dinge bedeuten werden 4 Begriff für Handy und immer wieder über den Weg laufen und die verstanden haben müssen das 1. ist die Semantik Vorlesung
heißt Semantik Web-Technologien das hat natürlich was mit Semantik zu tun und der Begriff kommt aus dem Griechischen Semantik was das heißt zum Zeichen beziehungsweise das ist die Sprache oder die Lehre von der Bedeutung oder bedeutungsleer und ist ein Teil der Linguistik und beschäftigt sich mit dem und der Bedeutung von sprachlichen Symbolen und von Zeichen also wie kann ich ein solches Zeichen interpretieren was steht für eine Bedeutung dahinter und wenn man sich das in der Sprachwissenschaft anschaut funktioniert meint so dass man von der Bedeutung von grundlegenden atomaren Begriffen versucht die Bedeutung von komplexer herzuleiten mithilfe syntaktischer Regeln als ich wie dieses auch einen formalen Sprachen gelernt haben und der Logik gelernt haben hatte man versucht man aus der Syntax versucht die dann einzuwenden und damit man die Frauen wie das funktioniert der Logik kennenlernen wird sich jetzt sehr kompliziert an ist aber gar nicht so kompliziert wichtig ist nur dass die Bedeutung von sprachlichen Zeichen natürlich immer davon abhängen in welchem Kontext das heißt in welcher Umgebung in welcher Situation sie gerade kommuniziert werden das heißt die Bedeutung einer Nachricht oder eine Information hängt vom Kontext hat also von der Umgebung und dazu noch von der so genannten Pragmatik Pragmatik ist die Intention die der Sender einer Nachricht hat also kann ironisch meine kann das ernst meine kann es nicht einst meinen das heißt jede Information nicht kommuniziere der dich den Absichten und das ist auf einer abstrakten relativ hoch einen das heißt um die Bedeutung von Wasser herauszubekommen muss sich auf der einen Seite wissen in welchem Kontext ist diese Informationen gegeben also was hat jemand vor der nachgesagt wobei ich mich zeitliche räumlich also beispielsweise wenn ich von Deutschland-Sprecher ist heutzutage nicht klar dass ich meine welche vor 250 Jahren bestand unter der von Deutschland gesprochen werde das was ganz anderes gibt ist es auch schon von den Rhein geographischen Grenzen verändern sich über die Zeit und das gehört zum Kontext zeitlicher Kontext ganz wichtig nach welcher Zeiten Aussagen getroffen wird hat eine andere Bedeutung weil die Dinge von denen ich der Zeit abhängig sind und dann auch was anderes bedeuten können andere Grenzen haben andere Dimension anderer Ausdehnung haben und dementsprechend ist das Ganze natürlich haben können alles andere als ein und konnte das kommt dann oben drüber noch die Pragmatik was man nicht und ich Intention hab ich das macht kompliziert an die Gleise der zentrale Begriff Semantik baut auf auf die Syntax
Syntax an alles schon angehört können sich spätestens oder kennen Sie nicht noch von Deutschunterricht irgendwie Syntax ist auch aus dem Griechischen das bedeutet letztendlich nichts anderes als die Zusammenstellung oder die Anordnung und dann von Zeichen und man nennt das auch in der Grammatik normalerweise die vom Satzbau das ist die Syntax und formalen Sprachen gehen Sie das auf der gibt dann nach den quasi oder die Syntax definiert nach wohlgeformte Ausdrücke aufgebaut werden können also das ist das was man brauche quasi um den formalen Sprachen hat sich arbeiten zu können wird es ein Ausdruck mit seiner Sprache oder nicht kann ich mit den Syntax die die Grammatik festlegt entsprechend entscheidet und in der Informatik spricht man auch von Syntax gibt die Syntax einer Programmiersprache dass ist müssen sich nicht mehr die normative Struktur von Daten letztendlich aber für uns ist Syntax endlich wichtig quasi dadurch dass die Regeln einen wie wohlgeformt erlaubte Ausdrücke aufzubauen Kontext der gerade von genannt der
Kontext quasi Kontext durch das kommt es aus dem lateinischen das Wort an gibt quasi oder beschreibt das Umfeld eines Wortes eines Begriffes im Zusammenhang mit den umgebenden worden die jetzt endlich dabei sind und in welchen Bezug miteinander also der Kontext quasi gibt hier wie ein quasi oder gibt einen Hinweis darauf die Informationen zu interpretieren ist und welche Bedeutung der steckt unter unterscheidet man den genannten generell Kontext zu gehören sagte schon gesagt haben Ort und Zeit den Aussagen getroffen worden ist und am quasi wie die Dinge miteinander zusammenhängen und auch noch den persönlichen oder sozialen Kontext das heißt wenn ich jetzt Aussage hab ich ganz besondere Rolle in unserem sozialen interagieren und spreche ich hier als Dozent deshalb quasi ist der Kontext dessen was ich sage immer wieder oder auch zu betrachten die ich jetzt nicht gerade befinde und normalerweise ist es so dass ich das jetzt in eine Rolle das was ich sage auch ernst meine und jetzt nicht bewusst welche Informationen geben möchte bei allen möchten Sie sich auch das Gute oder den der Klausur Schrei genau und obendrüber kommt dann noch die
Pragmatik also die Intention die letztendlich der kommunizierender hat oder die Absicht der die Nachricht abgegeben worden ist hat sich spiegelt der letztendlich wieder wie mit welcher sich die Sprache benutzt worden ist sagt man ebenfalls der griechische heißt die Handlung und und ja gibt die Absicht wieder in der die Sprache benutzt und eine Nachricht kommuniziert für und Fall also die sich 4 Begriffe der wenn sie immer wieder darauf stoßen Syntax Semantik Kontext und Pragmatik weil die wichtig sind und die Bedeutung von den irgendwie aufzulösen und zu bestimmen das Problem der es der Semantik suchen oder
Bedeutung so und nicht die ist nicht explizit gegeben weil es man die steckt in unserer Sprache implizit verborgen drin und der alle verstehen die Sprache das heißt wir verstehen auch was mit der Sprache gemeint es meistens jeder von uns hat natürlich seinen eigenen Kontext was ist deshalb kann es natürlich auch als wenn 2 Leute miteinander kommunizieren das als anderes meint als verstanden dass es auch wieder vom Kontext und der Intention und nicht mehr gegen die nicht gegenüber war die interpretiere ich das abhängig aber aber letztendlich wird machen wir quasi ständig in unseren Geist der Einnahmen darüber was könnte der an der jetzt gemeint haben versuchen und dann wenn wir kommunizieren auf den kleinsten gemeinsamen Nenner zu einigen so dass die Verluste die dann als bei den Kommunikation auftreten so gering wie möglich gehalten man kann das auch ein bisschen konkretisieren wurde Probleme aufgrund dieser impliziten Semantik auftreten zum einen von Menschen mit der das heißt wenn ich in einer Suchmaschine Versuche kennen
sie alle kann es passieren dass ein Begriff sie suchen mehrdeutig englischen Jaguar oder deutschen Sigolf suchen ist klar Adolf manch damit das Auto man damit die Sportart manch damit dem Golf von Mexiko bei Jaguar auch die 1. Sachen sein also Sprache ist in einer deutlich das bedeutet dass unter den Suchergebnissen meiner Suchmaschine der wirklich jetzt nach sprachlichen Zeichen sucht und vergleicht vielleicht noch Stammformen davon von sprachlichen Form bestimmt aber nicht also als nicht auf die die eindeutige Bedeutung dieser Begriff Aktien einen wirklichen Textvergleich gemacht bekomm ich viele nicht relevante Ergebnisse zurück ganz einfach aus dem Grund weil auch solche mehrdeutigen der Pullis nennt man das ein Begriff hat mehrere Bedeutungen Suchmaschinen normalerweise kein keine Rücksicht genommen wird genauso wenig unterschiedliche Kontext und umgekehrt bei einer Suchmaschine finden Sie mir von Google auch wirklich das wonach auch tatsächlich gesucht haben hatte der suchst bringen muss Dokument enthalten sein kann aber umgekehrt sein dass zu einem bestimmten Begriffe andere Begriffe existieren die genau das gleiche bedeuten zu sind und die dann natürlich nicht gefunden der Suchmaschine sondern muss sagte er dringend um eingeben der muss dann auch in dem Dokument sie können es noch weiter treiben also nicht nur Sinn und sie können Begriff auch komplett umschreiben und quasi immer vermeiden bestimmte Begriffe zu sagen aber sie wissen genau worüber sie reden da muss die Maschine erst mal drauf kommen und die Suchmaschine kann dass das heißt in der Sprache haben Sie sehr sehr viele Möglichkeiten Bedeutung implizit auszudrücken die Sie und ich verstehen dir mein Rechner noch lange nicht verstehen weil er auf einfache syntaktische Zeichen vergleiche festgelegt ist und keine gesagt dass die einst Worte bedeuten und was jetzt ein Synonym ist und dass es ein in Rom und ist also diese sprachlichen Einheiten die 1. eine Suchmaschine ab da kommen wir dann auch gleich zum nächsten Problemfeld
Nummer 2 nicht das Problem mit der Informationsextraktion werden dass schon dieser japanischen Webseite Zeitung gesehen entweder Information rausholen wollen das kann letztendlich nur jemand die Sprache auch versteht und der Mensch ist dann am Ende das heißt Informationsextraktion kann auf korrekte Art und Weise nur durch einen menschlichen Agenten vorgenommen werden weil er sich mit der Sache aus der Hand im Kontext der Weltwissen angesammelt hat sehr sehr viel Erfahrung wir alle lesen schon seit Jahren Zeitung und können deshalb interpretieren was in der Zeitung steht deshalb Informationsextraktion ist für den Menschen ganz ganz einfach für die Maschine schwer sich über die normale syntaktische Ebene hinaus soll und die Bedeutung dessen was da drin steckt denn tatsächlich auch verstanden werden soll war die Bedeutung viele Dinge die wir sprachliche sind die steckt ja nicht mal in den Worten die ist nicht explizit gegeben sondern die steckt implizit also haben sehr sehr viel implizit das wissen dass ist auch absichtlich dieses
Bild von diesen Sherlock Holmes es was genommen worden ist erkannt haben auf der ganzen geschlossen Art der geht es um einen Detektiv der normalerweise aufgrund seiner Frau Kombinationsgabe in der Lage ist jetzt Kriminalfälle zu lösen das heißt der steckt auch so genauso wie in Worten implizit vorhandene Informationen weil sie das irgendwann mal gelernt haben wissen sie weil sie sich die Information der steckt nutzen und interpretieren soll und sollte zieht der Westen ist Herausforderung von Suchmaschinen und genau so auf das antike weil dort wir vor der Aufgabe müssen die Quanteninformation explizit machen werde dafür sorgen dass wir auf die explizite Informationen kommen um das ganze verstehen zu nächstes Problemfeld Atoms der
nicht verstehen was in solchen Webseiten Informationen drinsteckt fällt es ist sehr schwer ab einer bestimmten Komplexität die Dinge den tatsächlich auch noch warten zu können und dafür sorgen zu können das alles konsistent ist unser unterscheidet man zwischen sogenannter syntaktischen Konsistenz und semantischer konsistent syntaktische Konsistenz ist eine ganz einfache Sache der gucken sei einfach nur auf die Links die in ihrer Website woanders hingehen und solange er einen Link tatsächlich auf eine andere Seite zeigt sie jetzt nicht 4 0 4 oder was zurückbekommen als HTTP ist Bansko dann wissen Sie es ist syntaktisch konsistent gelingt ist da man nicht da es sich kein konsistente syntaktische links 10. entsprechend HTTP Betancourt nicht zurückbekommen vermeintliche Inkonsistenzen sind viel viel schwieriger zu zu finden und stellen Sie sich vor Sie haben jetzt jene Website die auf der Welt die auf andere hält an der wir unsere Patch zu unserer Vorlesung und wir verdienten werden wir auf die andere Seite von hat und sagen dann dieser geht beispielsweise zur Homepage von Plugins Publikationen und das stimmt jetzt auch an den kommt aber jetzt und denkt sich hat diese Publications 2. was anderes aus Sicht könnte beispielsweise das Beispiel hierfür ist nichts Vernünftiges einen an dagegen würde dort die Fotos von unserer von von von unserer Forschungsgruppe publiziert hätten bei der eigenen Webseite stehen zu den Publikationen von bekommen aber auf der Seite mit lauter Fotos das heißt der Inhalt hat sich verändert das klingt ist noch da aber vermeintlich Städten Konsistenz Schreibweise die Information auf der verlinkten Seite und die Information auf der Seite auf die wir nicht übereinstimmen und ob das jetzt hat sich noch stehen doch das 2. übereinstimmt oder nicht das festzustellen ist viel viel schwieriger und viel aufwendiger und insbesondere dann wenn sie sich Webseiten ankucken die aus Tausenden und Millionen von Seiten bestehen wollen dann auch semantische Konsistenz sicherstellen dann wird es wirklich sehr sehr schwer und das wird es natürlich nicht alles im
Auge des Betrachters das heißt jeder von uns ist in der Lage aufgrund seiner persönlichen Situation die Dinge anders zu interpretieren und erwartet auch als auch von einer Suchmaschine andere Ergebnisse weil andere Erwartungshaltungen hat andere Interessen hat andere Vorlieben und jetzt quasi Informationsangebot zu personalisieren müssen wir natürlich auch noch entsprechend wissen was hat jetzt der Benutzer für vorliegt und da ist also ein trägt auf möchte ich von mir selbst preisgeben und quasi die gewünschte Information so bequem aufbereitet zu bekommen dass es jetzt tatsächlich das ist was ich wissen möchte einfaches Beispiel wenn sie sich ein Auto kaufen wollen und jetzt nach Gold suchten ist es für uns nicht klar als wäre vielleicht interessant die Autos mit diesen Namen herauszusuchen und jetzt nicht die die Golfplätze in Deutschland also das heißt es da es Informationen aus dem persönlichen Umfeld irgendwie nötig um jetzt genau dann das gewünschte Ergebnis und da es immer dann diese dieser dieser Wettstreit zwischen Personalisierung und Datensicherheit möchten Eigenschaft anhand Seite preisgeben auf der einen Seite muss natürlich nur und muss man diese persönlichen Informationen nach Art und Weise so konnte dass man sie auch so verwenden kann das man personalisiert inhaltlich darauf aufbauend Ergebnis aber nicht so einfach aber kennen lernen wie das geht es heißt es ganz Probleme kennen gelernt und die Frage ist der Mann also was das jetzt
Howard müssen wir damit weiter ein müssen man natürlich nicht eine rhetorische Frage jetzt seit ich nämlich wie
die Lösung dieser Probleme aus nicht was passiert jetzt tatsächlich Semantik explizit machen wenn man und diese Semantik Technologien einsetzen dazu dass man noch ein kurzer Schritt zurückgehenden erinnern uns ja einen Herrn der eines der
Highlights Nachrichten sehr schönes Bild gesehen dass manche Hindernisse und unten drunter stand der Developer großartig weil wirklich der Developer und und der hat gesagt dass er das eigentlich mit da ganz andern Intension entwickelt hat als es heute genutzt wird nämlich eigentlich hatte gesagt dass wir das schöne Zitate bei Post ist ein bisschen von Menschen ist würde würde ich würde User würden und Oliver jungen jungen Communications war aus so der Maschinen zu tun den also Maschinen sollten zusätzlich zur normalen menschlichen menschlichen Kommunikation Menschen Kreis 30 bei der Kommunikation unterstützen bei den Aufgaben die ich jetzt bei der Kommunikation bewältigen möchte aber um das machen zu können ist es notwendig dass die Informationen hatte die Inhalte der Kommunikation auch automatisch verstanden werden können und dieses automatische verstehen das
heißt Informationen müssen gelesen und korrekt interpretiert werden von Maschinen also müssen verstanden werden kann man auf 2 Arten bewerkstelligen dass eine ist man versucht linguistischer Technologien einzusetzen das ist die Art und Weise wie vom Menschen mit wie beispielsweise durch Suchmaschinen versuchen Informationen zu suchen und zu erschließen das heißt versucht man aus dem implizit in der Sprache vorliegenden Informationen aufzuschließen was es bedeutet und versucht daraus Ergebnisse zu mit manchmal guten manchmal qualitativ schlechten Ergebnissen und die 2. Möglichkeit wäre jetzt nicht die sie in der Sprache verborgene Bedeutung zu ermitteln sondern explizit für der Sprache die der haben noch eine zusätzliche Informationen zu geben in denen jetzt die Bedeutung kodiert vorliegt und zwar im Sinne von so genannten semantischen Metadaten das heißt man die zu so einer Webseite semantische Metadaten mit denen die wichtigsten Dinge oder deren Bedeutung dessen was der Sprache ausgedrückt steht noch explizit abgebildet und zwar so explizit das Maschine dazu nicht in der Lage ist das zu lesen und zu verstehen dass sie einfach gut gegeben diese Bedeutung explizit mit dann kann man ich das verstehen aber wissen noch lange nicht an das genau machen sollte diese Bedeutung explizit mitzugehen das müssen uns noch mal genau überlegen beziehungsweise das und innerhalb der nächsten Vorlesungen sein der nächsten Stunden sein und sogar explizit Mantik angibt und so dass man sie tatsächlich verstehen das heißt Semantik Web liegt
explizite Semantik vor ganz anders als aktuellen das heißt noch jugendfreies ohne Semantik explizite Semantik da ist kann man die Sachen tatsächlich manuell gesteckt dazu müssen uns noch mal ganz kurz in Erinnerung gerufen was bedeutet das eigentlich das zu verstehen insbesondere textuelle Informationen Beispiele aus ist ein weiteres Beispiel
2010 da war der Wahlkampf und in der Großbritannien und ja ich habe Zeitung herausgesucht auch wenn ihre Englischkenntnisse vielleicht ganz gut werden sie nicht sofort auf den 1. Blick verstehen was weiß ich gemeint ist in diesem weißen nach liefert wer weiß sofort was damit gemeint ist dann hat es richtig rausgesucht heißt es geht hier um 2 Leute und steht dann noch Chance verspätet und wenn es könnte man natürlich meine gut sind 2 Namen vielleicht in nach und der eine könnte und und scheint es auch noch drin also was bedeutet das es miteinander zusammen und wir sehen der steht bald kann das hat was mit Fußball zu tun also man muss erst mal den man muss quasi die Texte aus den
Bildern auslesen und dann muss man sich überlegen ob was könnte jetzt versuchen ein bestimmtes aus hat ist das man oder was was ist das herauszufinden was das 1. kann deutlich sein das ist das große Problem müssen eindeutig feststellen was ist denn die Bedeutung genau dieses Begriffs und dieses eindeutige feststellen von Bedeutung gemeint ist die Gruppierung also das heißt wir wollen die Mehrdeutigkeit Antiquität auflösen und wollen weil sie eine eindeutige Lösung für die Bedeutung von diesen finden sich das jetzt mal angucken ein sogenanntes geht auch durch durchführen wollen also kann wirklich vieles bedeuten wenn man nach dem der Wikipedia ist kann mit einem Waschmittel das heißt es geht weiter mit einem nicht näher bezeichneten kann ist es die 2. Weise sowie Wort ist eines der hier und da er es gibt das das was ist ein bisschen was weiter als einen brasilianischen was Gewalt der mit den Namen von haben und Leute wie beispielsweise Grammar von einer Gruppe den einzig sich das Works Fabrizio Moretti kann ich auch nicht und es gibt der tatsächlich damit gemeint war war das Aufkommen der das ist das ist hier der Nationaltrainer der britische Fabio Capello als und Manager auf die 1. für dort das heißt der 1. Prozess wenn man solche Informationen analysiert man muss herausfinden ob das oder nicht das ist kann das heraus dass es sich bei diesen Text tatsächlich hat der Kapelle auch wenn das dann haben herausgefunden haben dass es war bekannt läuft und das im Moment noch gar nicht ich weiß von kannte Fabio Capello vor dem heutigen Tag dann nicht mehr ein dann haben sie eine Affinität zu Fußball genau das heißt Tage Capello ist mehr als nur ein Text Zeichenkette sondern dass es ein muss man dazu wissen ein so kann man als ein Trainer und das reicht aber nicht als Information müssen wissen was ein Fußballtrainer jetzt ist beispielsweise so Klasse von der 1. Person also den Fußballtrainer ist eine Person und dieses Wissen das der konnten die haben und damit verbinden können dass wir uns schon mal wirklich ein ganzes Stück weiter das heißt abstrakt ausgedrückt müssen herausfinden
Fabio Capello ist ein Identität müssen diese eine Entität müssen die einer Klasse Zuordnung beispielsweise Fußballtrainer und müssen auch noch herausfinden wie einzelnen miteinander zusammen um zu verstehen was was es bedeutet ein Fußballtrainer oder eine Person zu sein ganz einfaches Beispiel dazu wieder von
Entitäten und lassen aus objektorientierten Programmierung ist noch ein bisschen mehr eingeben und zu verstehen was jetzt die eine Person sein kann kann also beispielsweise seien eine Person hat immer eine Geburtsort und wenn Fabio Capello als Geburtsort hat das ist dann auch ein ganz bestimmter aber können wir beispielsweise aus der Informations und ist der Geburtsort von Fragen ist auf jeden Fall ein Ort auf der anderen Seite können wir auch noch herauskriegen das beispielsweise eine Person Geburtsdatum hat und bekannt war dann entsprechen dazu auch ein Geburtsdatum ableiten das das Geburtsdatum und hat kann tatsächlich ein Datum ist das heißt so kann man sich Wissen um Zusammenhänge quasi erschließen aus vorgegebenen Wissensrepräsentationen die man miteinander zu setzen wenn das Netz dass man aufbaut groß genug ist dann auch irgendwann mal verstehen was ein Fußballtrainer ist allerdings auch bei der für natürlich noch viel viel mehr Information aber das sollte als normaler zu gehen und den Anhaltspunkt zu geben wie funktioniert das Ganze wie kriegen wir quasi die Bedeutung herausgekommen können die Bedeutung der 38 dann kann der den Begriff der Antike schon ganz steht
er nämlich dass man den Wert der definitionsgemäß nichts anderes als Erweiterung des aktuellen World Wide Web nur mit dem Zusatz dass man jetzt die da drinnen als Information stehen eine wohldefinierte Deutungen zuordnen kann das muss nicht alles in einer Webseite stehen da brauchen einen Link quasi dorthin zu gehen wo erklärt wird was jetzt Fußballtrainer ist und das ganze muss maschinenlesbaren Maschinen verstehbar sein und dann quasi kann man verstehen was quasi an Information drin steckt und dann können wir entsprechend automatisiert weiter verarbeitet also wirklich wunderbar das heißt die
Bedeutung der Information die Semantik mit explizit angegeben in formalisierten standardisierten Wissensrepräsentation sogenannten Ontologien und damit wird dann sehr sehr einfach dieses Wissen automatisiert weiterzuverarbeiten damit sind wir dann in der Lage quasi auch Daten die auf den 1. Blick nicht zusammenpassen den unterschiedlichsten Formaten abgelehnt abgelegt sind quasi zu integrieren zusammen zu behandeln zu verstehen wie die miteinander zusammen zu sein und werden auch in der Lage versteckte Informationen implizite Informationen aus dem gegebenen bis heraus zu schließen mit Hilfe von Deduktion setzen also an der ist das antike nichts anderes als eine globale Datenbank in der kann so eine Art universelle Netzwerk von semantischen Aussagen abgelegt wenn Sie mich fragen wie machen wir das dann sage ich mir diesen schönen Architektur starb stellte ich
alles drin was der Rest der Vorlesung oder den nächsten 2 Dritteln machen werden um uns diese ganzen Technologie nicht ineinander verzahnt sind mal ein bisschen besseren Eindruck haben was da eigentlich so drinsteckt Schauenburg Alfons Kasachen man beispielsweise aus also ganz unten stehen und quasi
müssen 1. Versagen worüber wir uns unterhalten hat die Dinge müssen die identifiziert werden weil er selbst sind identifiziert Dinge ganz einfach am besten über eine URL kennen Sie abstrakte Konzept des US ist das so genannte un der Juni von wies Oswald die Feier damit kann ich dann nicht nur jetzt Dokumente identifizieren sondern auch alle möglichen Dinge im realen Leben können irgend eine bekommen irgendein Modifizierer nicht benutzen kann und um über diese Dinge dann stellvertretend Aussage dass auch wenn lustigen den unserer und der oder die selbst in der in der Lage aus abstrakten Zeichenketten wie hier oder in das Wort Sprecher aus Symbolen quasi dasjenige herauszufiltern was ich damit meine und die Aussagen dann auch so zu verstehen dass wenn eine Aussage treffen beispielsweise bei der mag sie nicht unbedingt vor sich sehen setzten haben müssen oder ja genau das tun sie müssen das jetzt von sagen würde um sich vorzustellen was er tut das ist sozusagen sein Kopf in einer Art Stellvertreterkrieg statt und wir quasi Begriffe anstelle des tatsächlichen Dings und genau dieses dieses stellvertretender wird auch hier Semantik der genutzt und quasi Aussagen über den in der realen Welt treffen zu können und die trotzdem zu verstehen was machen wir dann nächste ist mit also merken sich nur Dinge werden wir normalerweise durch ganz einfach nur gekennzeichnet damit ich Aussagen darüber treffen beispielsweise ganz wichtig ist den purer gegen werden ist die
Wikipedia und darauf aufbauend diesem an dich Version der Wikipedia die Wikipedia der von ihnen hat schon mal was von der GdP ja gehört das sind ja doch einige wunderbar brauchen wir dann so groß gar nicht wiederholen einerseits die Info-Box dass hier am rechten Rand sieht in den strukturiert Information abgelegt die dann in Form quasi einer
angestellt waren in der zugegriffen werden kann dort ist diese ganze Informationen über Advokat Leute jetzt worden aus der Infobox abgelegt und mit der kann ich dann entsprechend aber abgelegt ist das Ganze in einer einfachen
Beschreibungssprache ist aus des britischen für war also RTF und RDF Aussagen setzen sich immer ganz ganz einfach zusammen bestehen aus einem Subjekt über das eine Aussage getroffen wird als in dem Fall Ausfahrt Capello und dieser Tage kann durch und Typ so kann man also der ist ein Fußball nach und das ist auch schon fertig sagt also aus Subjekt der Property und der der Hauptwerk setzt sich Einheit zusammen und viele solche tritt Formeln dann am Ende August sagen mit die nicht wissen was sie könne die als setzt man nicht viel weiter damit kann wird ein großes Netzwerk was den brauchen aber Hintergrund dann auch noch normative Aussagen darüber
was ist denn jetzt ein Fußball Manager Was ist eine Person eine Person die zusammen mit anderen Dingen wie beispielsweise mit horten oder Zeitpunkt das Nachricht an ein mit beispielsweise der das Klima oder auch Paul damit die nicht in der Lage da sie um einige Beispiele einzugeben dies durch Klassendefinitionen und solche Zusammenhänge kodiert als das Ganze jetzt noch das ist schlimm aber dass sie in 2 Wochen quasi aus dem bis jetzt die das Ganze noch aus ganz harmlose Daten interessant wird mit dem nächsten Schritt den ich auch nur andeutungsweise quasi
erstmals zeigen nämlich ich kann er gehen und kann so genannte Konsequenz oder einen für die beispielsweise seine Tage Capello ist eine lebende Personen auf der anderen Seite gibt es auch noch vor oder Personen und ich stehe jetzt Regel auf das Leben der und wurde Personen dieser letztendlich disjunkt seien diese beiden also das heißt soviel wie keiner kann gleichzeitig oder Tod sein aus welchem hier und das ist mir schon weiter als in die ich mich ich nicht ich moderiere zu verstehen weil ich geben kann die Dinge miteinander zusammenhängen und so konnte die recht mit Hilfe logischer Aussagen ist dann ist Kreise die Welt zu verstehen daß und halten kann mit Hilfe der Beschreibungslogiken ein Schreiben zu den Ausdruck quasi zeigen können oder formulieren was ist denn jetzt quasi ein toter Mensch toter Mensch ist jemand der Todesdatum an hier Beschreibung unten unterstehen die Ausdrücke wenn sie dann wenig später sowie Weihnachten auch die von der Hand geht was wird das ganze wenn ich nicht abfragen
kann ich hatte die Sprache schon mal ganz am Anfang des Parkes jetzt eine Sprache mit der reine Abfragesprache SQL mit ist ein solcher Wissensbasen ganz einfach abfragen machen kann also ein einfaches Beispiel formulierte suche ich nach einem Fußballspiel in der Nationalmannschaft mehr als 10 oder Tore geschossen haben kann man wunderschönen sie nicht aus der SQL formulieren sind ein paar kleine Sachen drin ist komplizierter ausschauen also ich kommt noch die englischen und hätten auch noch habe ich und ich weiß nicht was mit den und am ordnet das Ganze dann auch noch absteigend so das sie die mit meisten von vorne dran ist was sich dann als Ergebnis haben können sie zwar nicht mehr gewesen ist aber
eine sehr schöne und da steht oben Darfur Stefan sollen mit 1500 und und das ist auf der einen Seite das schöne auf der anderen Seite auch die Crux mit der die Wikipedia das ist nicht die Datenqualität wenn sich das man nicht mehr ankucken was da drin steht das ist jetzt eigentlich Handballspieler hatten nach sogar angefragt als interessante ist natürlich gibt es Handballspieler nebenher auch Fußball spielen aber nicht gleichzeitig auch der Fußballnationalmannschaft sondern vielleicht nur zur also Fußballspielen das heißt ich hätte der Abfrage auch noch sagen müssen nicht nur welcher Fußballspieler sondern welcher Fußballspieler hat in der Fußballnationalmannschaft während eines Spiels der Nationalmannschaft tatsächlich auch ein Tor geschossen muss ganz genau gucken was man hier zusammengefasst und außerdem es so dass sich der gegenseitig nicht notwendigerweise ausschließt zu Handballspieler kann gleichzeitig auf Fußballspiel sein und ich denke also ist schwarz drin Datenqualität ist manchmal sehr zweifelhaft und das hätte ich unglaublich gekommen ist auch ganz vom Primat der kann ich auch noch bei mir ok also Datenqualität werden wir sehen ist ein bisschen Probleme gut ganz zum Schluss kann nach einem was dann mit dem
ganzen wenn wir tatsächlich ist explizit nach und damit arbeiten können machen können das 1. der später hatte heute
auch schon mal den werden kann der schon den Begriff später oder hatte damit schon mal was zu tun wenigstens auch schon als zentraler Dreh und Angelpunkt Drogentäter und das ist die der von der gerade schon gesprochen habe an der die sich sehr sehr viele öffentlich verfügbare Datensätze aus strukturierte Daten an die kommen aus allen möglichen Bereichen Peter-Klaus dann auch ein bisschen genauer anschauen was dafür Datensätze alles drinnen sind dass man da ein bisschen eines gebrauchen kann insgesamt sind die Zählung stammt von letzten Jahren in den nächsten Monaten Schätze Anfang November die neue Zählung veröffentlichte letztes Jahr waren noch 31 Milliarden Fakten also doch schon den ganzen und 500 Millionen links hinter den Datensätzen zwischen den also da steht ganz gewiß Westen und das Schöne ist das Ganze ist kodiert RDF das heißt dass ist ein einheitliches Format braucht keine speziellen hat sondern auch tatsächlich zugreifen zu können ich kann das mit HTTP ganz einfach HTTP-Request abfragen kann darauf sehr sehr einfach mehr Staatsaufbau
bekannt Staat das darauf aufbauen und auch eines der ältesten eben nicht mehr so gut dass ist die BBC News Zeit also wenn sie zu BBC gehen und dort den Musikbereich einen werden da sie Einblick in das laufende Radioprogramm der BBC und dort wird normalerweise aus haben da das heißt aus der Wikipedia und noch aus anderen Diensten wie beispielsweise Music Frames Descartes dass eines Datensätze die sind ziemlich aktuellen auf den den Tag laut Informationen zum aktuellen Programmen rausgeholt Unsinn auch quasi ständig aktuell ohne dass jemand der Webseiten kauern und Informationen rausholen muss sondern man kann wirklich auf diese Daten über eine einheitliche Schnittstelle zugreifen kann auch gepflegt in der Wikipedia immer schön aktuelle und ich habe wenig Aufwand quasi Informationen zur Verfügung zu gestellt also das Besondere an solchen
Webseiten sind dass man kein Squeak machen muss um an Informationen zu kommen die dahinter stecken dass dafür keine spezialisierten hat ist der Informationsangebot benötigt die abgefragt werden sollen sondern dass man das ganze quasi ja Drogengelder und HTTP-Request ohne weitere manuell Interaktion sehr sehr schön Abfrage weiterer Vorteil den ich habe wenig ich mit semantischen Technologien Arbeit der erschließt sich dann später bei Suchmaschinen nicht
beispielsweise Monster kann man in der kommenden gesagt Sprache ist mehrdeutig selbst wenn ich sein können habe ich möchte Jaguar auf 2000 ist nicht klar was gemeint ist das 1. muss man ja Jaguar interpretieren das kann die Katze sein kann das Auto sein das kann man sich erinnern sich noch das Betriebssystem seinen Kurs von 2 glaube ich war es Jaguar und es gibt auch noch viele andere Bedeutungen von Jaguar ich muss das erst mal raus wenn ich das irgendwie herausgefunden aber ok ich möchte in Richtung Auto weiter muss sich den Rest interpretieren und muss herausfinden
ja was bedeutet dass 2000 bedeutet dass eventuell bei mir auch im Jahr bedeutet dass ich möchte ein mit 2 Tausend Kombi-Coupé Raum oder mit 2 Tausend PS Leistung haben oder so dass muss ich erst mal raus und das heißt es der schwierigen Geschichte so was dann zu interpretieren das heißt Suchmaschinen sind Dokumenten 3. an immer das Problem ich muss
den ist korrekt interpretieren dazu brauch ich eigentlich Kontext wissen muss ein bisschen was über den Benutzer wissen ich muss Entitäten korrekt zu beweisen können es gibt jetzt sehr schön schönes Beispiel bei Google haben Sie vielleicht schon gesehen sprach der wird Versuch zu Entitäten sucht dringend zu werden Informationen aus Weststandard weil sie dann noch mit einem zur anzuzeigen dass können und dann noch mal genauer ankucken es muss also automatisch disambiguiert werden und dann ist natürlich die Frage nach der Suchmaschine die ich irgendwie versteht kann sie nicht von Anfang sind zu wenig seiner zu wenig konnte Information hat muss er ständig Nachfrage das nervt mich das heißt es die Usability auch sehr schnell zum Teufel und ich muss was das nach Art und Weise vernünftig dazu mit weitere Variante der
Suchmaschinen sind nicht die Suchmaschinen die Dokumenten Retrieval machen sondern sogenanntes steckt wird für Wolfram Alpha kennen vielleicht manche von der hat noch nie was von Wolfram Alpha gehört wie sehen es gibt nicht so viele wie noch nie was davon gehört die Domain stellt Fragen und bekommt irgendwann Antworten besteht heutzutage auch schon ganz gut also man kann sich das so vorstellen und ist mit dem Auto unterwegs möchte wissen wofür nicht in die nächste für nicht günstigste Tankstelle also ich möchte auch günstig kann und ich möchte mit dem was ich Tank habe zunächst den günstigsten dann steht auch noch am besten kommen nicht an die Antwort ich muss jetzt hier von mir aus nach von Unfällen kennt keine weil weil die vorher noch aus China stand und der steht dann angezeigt was aktuell das Benzin dort kostet das wird oder ausgerechnet für die spritsparend als nicht eindeutig in bringt und eventuell wird dann auch noch im Auto eingegriffen und gesagt und nicht auf das Gaspedal nur noch halb treten weil sonst schafft es nicht bis zur Tankstelle also solche Sachen kann man sich das vorstellen die Hilfe semantischer Technologien möglich weiter Forschungsschwerpunkte auch
bei uns in der Gruppe haben im Mittelpunkt steht die so genannte explorative Forscher Suche da geht es darum dass ich jetzt wie sie es heutzutage eigentlich machen Dokumente oder Ergebnisse suchen bei denen sie eigentlich schon ganz genau wissen was sie auch das heißt das Suchergebnis liegt vor den Kopf nicht klar was sie wollen das heißt sie müssen nur noch entsprechen spezifiziert kriegen dann das gewünschte Ergebnis aber wenn sie einfach nur stöbern wollen wir wissen wollen aber es gibt es denn alles in den Mund den Bereich der mit heutigen Suchmaschinen großes Problem weil sie können gar nicht alle Ergebnisse die Kugel inwieweit diese Millionen Ergebnisse durch Scrollen irgendwann wenn sie dadurch wird ist nach 100 Seiten Schluss und keiner hat auch den Nerv des zu machen und sie sehen auch nicht die Ergebnisse werden miteinander zusammenhängen und wenn sie quasi Informationen haben einzelne sagte am Abend war vielleicht erkannt und jetzt zusammen mit den anderen Kronen man von Apollo 11 und quasi kann man hier in denen der Code und genau so kann eine der Verbindung zu von Apollo 11 zu Apollo 13 und alle wissen das Apollo 13 erfasst was passiert ist man dann wenigstens bis in den Nacken man sehr leicht auch zum Hellernscher Desaster also das heißt es statt hier war geflogen ist und weil sie solche Verbindungen zu knüpfen auf inhaltlicher Basis das ist auch eine Form der bereit jeden Suche und da kann man den Nutzer dann auch unterstützen sehr sehr große reicht die nach eigenen oder den eigenen Interessen zu durchstöbern und dabei den semantische Technologie Mama ganz
am Schluss noch 2 Vergleiche zwischen der Semantik damit es noch mal mit klarer der Technologie heute Technologie morgen man sich das vorstellen muss heutzutage haben Informationen suchen den eigenen nicht Google und wir haben wenn wir Informationen darstellen wollen den eigenen Dienst den Browser der das der zwischen diesen des 1. Service Service für Informationen suchen und Informationen darstellt Semantik der wird das ganze bisschen anders aussehen wenn man das quasi zu hätte dann jeder Nutzer für sich bezogen einen persönlichen Assistenten das ist nichts anderes als ein intelligentes Programm das in der Lage ist auf den jetzt hier intelligente Infrastruktur Dienste zurückzugreifen also sich Kandidaten zusammensuchen ich kann mir Daten und zusammengesucht habe nach bestimmten Kriterien AG berechnen und kann sich keiner virtuelle aus den vorliegenden Dokumenten entsprechend meinen persönlichen Informationsbedürfnisse Informationen rausziehen virtuelle zusammenstellen lassen dass es also quasi also diese Vorstellung Semantik der im Gegensatz zu heute Informationen sich auf automatisierte Art und Weise zusammengestellt ganz am Schluss Jahr
3 Generationen von Webseiten man früher einfach nur statische Seiten hat die deren Erscheinungsbild bestimmt worden ist durch hat und es und heutzutage interaktive und dynamische Webseiten hat der deshalb weil wir über Java Script
oder auch manchen aber jetzt tatsächlich Interaktion zulassen beziehungsweise dynamische Seiten aufbauen können aus mit Hilfe von Datenbanken Content-Management-System wird das Ganze in der nächstfolgenden in der 3. Generation zu sogenannten virtuellen Webseiten die die mit Hilfe von Ports quasi Informationen zusammensuchen mit Hilfe von diesen persönlichen Informationen Assistenten hat gehen und so wie wir es gerade haben wollen zusammenbauen adaptiv in diesem Sinne reagieren die tatsächlich echtes planen stattfindet die ich jetzt als Information an ihre beruhigt und Autoren ich sie dann an der darstellt zusammenspielen tun dann in diesem
Land der ganze Reihe von unter Disziplinen der Informatik Künstliche Intelligenz gehört genauso dazu wie wie die Computerlinguistik die Kryptographie Datenbanken gehören dazu Theoretische Informatik gehört dazu Logik also am davon gehört gehört dazu Rechnerarchitekturen gehören dazu Softwareengineering gehört dazu Systemtheorie und natürlich noch Computernetzwerke sie sehen wir sind wie sehr sehr bereits mit Semantik der Technologien der aufgestellt und haben damit auch tatsächlich jetzt geschafft haben Minuten zu spät angefangen noch Minuten zu spät auf damit haben was heute die Telekom das ist
eigentlich die merken Sie sich der heute sind Informationen gibt es hier nicht explizit gegeben wir versuchen sie mit Hilfe von 10 meinte Web-Technologien explizit zu machen das automatisiert verarbeiten können und versuchen damit dann intelligenter Anwendung letztendlich auch in der nächsten Stunde geht es weiter mit der wir gucken und Gespräch
die an wo sie ja alle schon aber noch mal dieses Problem nicht verstehe ich wenn ich einen Stellvertreter arbeitet das sich trotzdem quasi das durchsichtige Stellvertreter meiner eigentlich dass das Stellvertreter bezeichnet dann also damit ein Sprecher des kompliziert XML zuletzt am Morgen dann und dann geht es auch gleich noch weiter nächste Woche mit dem bis auf das wir uns geschaffen
ALT <Programm>
Mathematik
Berührung <Mathematik>
Content <Internet>
Systemtechnik
HTTP
Computeranimation
Web log
Multimedia
Wissensrepräsentation
Web log
Multimedia
Information Retrieval
Information
Analysis
Computeranimation
Wurm <Informatik>
Zugbeanspruchung
Rundung
Analysis
Computeranimation
Web Site
Web Site
Version <Informatik>
Matroid
p-Block
Information
Information
Computeranimation
Wissensrepräsentation
Google
Anwendungssoftware
Content <Internet>
Ähnlichkeitsgeometrie
BASIC
Information
Datenstruktur
Computeranimation
World Wide Web
Richtung
Wissensrepräsentation
Ontologie <Wissensverarbeitung>
Beschreibungssprache
Prädikatenlogik
Aussage <Mathematik>
Künstliche Intelligenz
Content <Internet>
RDF <Informatik>
Komplex <Algebra>
Informatiker
Terminologische Logik
XML
BASIC
Abfragesprache
World Wide Web
Attributierte Grammatik
Relationale Datenbank
Wissensrepräsentation
Datenhaltung
Beschreibungssprache
Multimedia
Datenbank
Formation <Mathematik>
Content <Internet>
Computeranimation
Keller <Informatik>
LINUX
Software
Anwendungssoftware
Quelle <Physik>
Folge <Mathematik>
Wissensrepräsentation
Formation <Mathematik>
Web-Seite
p-Block
HTTP
Informationsvermittlungsstelle
Volltext
Web-Seite
Zahl
Computeranimation
Rechenbuch
Semantic Web
Internet
Rechenbuch
Perspektive
Content <Internet>
Content <Internet>
BASIC
HTTP
Computeranimation
Internet
World Wide Web
Binärdarstellung
Internet
Polarkoordinaten
Rechenbuch
Office <Programm>
Betriebssystem
Information
Information
Zahl
Computeranimation
Larry <Programm>
Schnittstelle
Internet
Datei
Browser
Programm
ACCESS <Programm>
Datenendgerät
Information
Computeranimation
Intranet
Rechenbuch
World Wide Web
Turing-Test
Hypertext
Multi-Tier-Architektur
Information Retrieval
Downloading
Benutzerführung
Information
Internet
Bordcomputer
Aktion <Informatik>
Hyperlink
Browser
REST <Informatik>
Browser
Formation <Mathematik>
ACCESS <Programm>
Information
Computeranimation
Index
Rechenbuch
Hypertext
Information Retrieval
World Wide Web
Dienst <Informatik>
Benutzerfreundlichkeit
Hypertext
IMS
HANS <Datenbanksystem>
Internet
Benutzeroberfläche
Sondierung
Benutzerfreundlichkeit
Browser
Default
Großrechner
Computermusik
Service provider
Netzadresse
Computeranimation
Index
Rechenbuch
iPad
Zählen
Korrelationskoeffizient
Benutzerführung
Term
Internet
Manufacturing Execution System
Familie <Mathematik>
Multiplikation
Content <Internet>
Provider
p-Block
Web-Seite
Systemplattform
Soziale Software
Computeranimation
Richtung
Information
RSS <Informatik>
Social Tagging
Internet
Cross-site scripting
Google
Browser
Content <Internet>
Wort <Informatik>
Information
Computeranimation
Internet
World Wide Web
Mathematische Größe
Google
Microsoft Network
Web-Seite
Zahl
Index
Web log
Index
W3C-Standard
Rechenbuch
Suchmaschine
Zoom
Wort <Informatik>
Größenordnung
Google
W3C-Standard
Uploading
Apple <Marke>
Internet
Facebook
Google
Informationsüberlastung
YouTube
E-Mail
Computeranimation
Internet
Punkt
Gleitendes Mittel
Web-Seite
Information
Netzadresse
Computeranimation
W3C-Standard
Rechenbuch
Menge
Suchmaschine
Information
Datenstruktur
Systems <München>
World Wide Web
Zeichenkette
Informatik
HTML
Information
Web-Seite
Netzadresse
Computeranimation
Programmiersprache
Sender
Informatiker
Laufzeitsystem
Formale Sprache
Aussage <Mathematik>
Information
TICS
Komplex <Algebra>
Computeranimation
Ausdruck <Logik>
Zusammenhang <Mathematik>
Sender
Regulärer Ausdruck
Aussage <Mathematik>
Wort <Informatik>
Information
Arbeitsplatzcomputer
Computeranimation
Einfügungsdämpfung
Rechenbuch
Suchmaschine
Information Retrieval
Wort <Informatik>
Computeranimation
Maßeinheit
Ebene
Distributionstheorie
Agent <Informatik>
Besprechung/Interview
Web-Seite
Information
Computeranimation
Software
Suchmaschine
Atom <Informatik>
Quanteninformatik
Wort <Informatik>
Information
Information Extraction
Web Site
Semantische Konsistenz
Plug in
Web-Seite
Binder <Informatik>
Information
Datensicherung
Computeranimation
Homepage
Patch <Software>
Suchmaschine
Information
Inkonsistenz
Kreis
Highlight <Programm>
Content <Internet>
Content <Internet>
Information
Normalvektor
Computeranimation
Internet
World Wide Web
Metadaten
Suchmaschine
Content <Internet>
Information Retrieval
Interpretierer
Information
Web-Seite
ART-Netz
Semantic Web
Objektklasse
WORKS Suite
Whiteboard
Momentenproblem
Content <Internet>
Information
Affine Abbildung
Computeranimation
Zeichenkette
Gruppierung
Wissensrepräsentation
Objektklasse
Zusammenhang <Mathematik>
Objektorientierte Programmiersprache
PACE
Content <Internet>
Information
Lisa
Computeranimation
Subclass <Programmierung>
Erweiterung
Wissensrepräsentation
Ontologie <Wissensverarbeitung>
Datenbank
Aussage <Mathematik>
Maschinelle Lesbarkeit
Information
Binder <Informatik>
Web-Seite
Computeranimation
World Wide Web
Dateiformat
Information
James <Programm>
Aussage <Mathematik>
URL
Computeranimation
Keller <Informatik>
Zeichenkette
Typ <Informatik>
Beschreibungssprache
Aussage <Mathematik>
RDF <Informatik>
Version <Informatik>
Information
Computeranimation
X3D
Zusammenhang <Mathematik>
Terminologische Logik
PACE
Aussage <Mathematik>
RDF <Informatik>
Computeranimation
Subclass <Programmierung>
Ausdruck <Logik>
LARS <Programm>
Informationsqualität
Statisches RAM
Abfrage
RDF <Informatik>
Mensch-Maschine-Schnittstelle
Abfragesprache
Tor <Netzwerk>
Simulation
MOCCA <Programm>
Computeranimation
Datensatz
Content <Internet>
RDF <Informatik>
Strukturierte Daten
Zählen
Computeranimation
Internet
World Wide Web
Schätzfunktion
Rahmenproblem
Programm
Abfrage
Web Site
HTTP
Information
Web-Seite
API
Computeranimation
Dienst <Informatik>
Datensatz
Suchmaschine
Information
Schnittstelle
Google
Benutzerfreundlichkeit
Besprechung/Interview
POWER <Computerarchitektur>
Betriebssystem
Benutzerfreundlichkeit
Richtung
Monster-Gruppe
Zeichenkette
Typ <Informatik>
Suchmaschine
Parametersystem
Information Retrieval
Information
Zeichenkette
Mathematische Größe
Information Retrieval
Kugel
Suchmaschine
Vererbungshierarchie
Besprechung/Interview
Information Retrieval
Information
Code
Computeranimation
Dienst <Informatik>
Ungleichung
Google
Agent <Informatik>
Browser
Information Retrieval
Information
Web-Seite
Assistent <Programm>
Computeranimation
World Wide Web
Computerlinguistik
Systemtheorie
Datenhaltung
Reihe
Künstliche Intelligenz
ACCESS <Programm>
Rechnernetz
Web-Seite
Content Management
Computeranimation
Informatiker
Kryptologie
XML
Information
Computerarchitektur
TICS
Assistent <Programm>
Software Engineering
Theoretische Informatik
Content <Internet>
Information
Computeranimation
Internet
World Wide Web

Metadaten

Formale Metadaten

Titel 01 Semantic Web Technologien - From Internet to Web 2.0
Serientitel Semantic Web Technologien WS 2012/13
Teil 1
Anzahl der Teile 4
Autor Sack, Harald
Lizenz CC-Namensnennung - keine kommerzielle Nutzung 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen und nicht-kommerziellen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
DOI 10.5446/14282
Herausgeber Hasso Plattner Institut (HPI)
Erscheinungsjahr 2012
Sprache Deutsch

Inhaltliche Metadaten

Fachgebiet Informatik
Abstract semantic web technologies internet web 2.0

Ähnliche Filme

Loading...
Feedback