Bestand wählen
Merken

Einführung (Teil 2) / Vom WWW zum Semantic Web

Zitierlink des Filmsegments
Embed Code

Automatisierte Medienanalyse

Beta
Erkannte Entitäten
Sprachtranskript
werden damit Kurve Fotos gemacht und die werden dann miteinander elektromechanischen diesen Schreibtisch stand verlegen also sehr interessante Geschichte kann man sich sparen gucken und heutzutage 7 dann dass wir
daraus entstand auch das wird so erfolgreich werden konnte lag an der Benutzerschnittstelle hatten wir schon gesagt am Anfang war das Ganze natürlich immer noch textbasiert vielleicht einige von diesen Browser Lynx noch gab es zumindest anfänglich den Linux-Distributionen noch dazu kommen textbasiert das heißt man hatte jene Tastatur und man konnte ich mit dem Cursor Tasten oder mit der Tabulatortaste dann diese markierten Teile dass man als auswählen und mit der Bariton fast oder Eingabetaste dann aktivieren hat sich nicht durchgesetzt durchgesetzt hat sich
dann die grafische Variante die ein Jahr später von haben sich der Siemens Muster war der 1. grafische Webbrowser mit anderen mit der Maus darauf zugreifen konnte sowieso sollte unter dem Namen das Ganze so eine rasante Entwicklung so das
heute über 600 Millionen Euro 1 IP ist aber das Internet Server irgendwo im Internet herumstehen haben aber
kommt es gibt hier sieht man großer Teil der Bevölkerung oder signifikanter Teile der Bevölkerung muss man schon sagen ist mittlerweile schon im Internet vorhandenen in Europa
allein ist Deutschland die können Internet Nationen mit 52 innerhalb Millionen Nutzern das ist schon sehr großer Anteil an der Bevölkerung aber aber das wird wie wir es kennen hat sich auch in 20 Jahren sollte es das gibt nicht verändert am Anfang war es noch
so dass es sich verhalten hat wie ein konventionelles Massenmedium also quasi die Zeitung oder Rundfunk auch das war ein sich darauf ausgerichtet dass man Informationen konsumiert als Informations Konsumtion stand im Mittelpunkt des gab einige professionelle Anbieter und das lag daran dass für das Anbieten von Information wird doch noch Expertenwissen notwendig war also ich musste dazu ein dazu aber aufsetzen kann ich musste wissentlich HTML-Seiten und vielleicht auch hier Datenbanken und ähnliches bedienen bedienen kann und das Problem war Informationen anbieten dazu war noch wirklich komplex ist es notwendig aber das hat sich auch in den letzten Jahren verändert und das haben sie sicherlich mit verfolgt das mittlerweile Tools existieren die jeden Nutzer in die Lage versetzen auch ohne Expertenwissen selbst am Netz teilzunehmen teilzuhaben selbst Information bereitzustellen unter dem
Schlagwort der 2 0 das sich selbst und nicht für so gut gelungen halte weil es ist ja kein anderes als das das wohl auch da war man hatte zwar andere oder benutzt zum Teil Programme die vor auch schon vorhanden waren aber jetzt am neue Absicht oder mit schöneren Benutzeroberfläche marketingtechnisch ist natürlich wunderbar Begriff weil er seit einigen Jahren geistert das durch die Presse und jeder der heute oder Anwendung auf den Markt bringt die ist natürlich auch 2 0 ich was auch immer man damit ausdrücken möchte auf aber davon abgesehen ist das World
Wide Web ziemlich groß bedeutet dass das auch gesagt hat das Universum ist ziemlich groß genauso verhält es sich mit um das ganze Zahlen zu fassen wird das Ganze sehr schwierig das aber auch Suchmaschinen schon vor einiger Zeit aufgewölbt Angaben darüber zu machen wie groß der Suchindex ist die letzte Zahl die auch nicht verlässlich sondern eher so als verlässlich geschlussfolgert werden konnte aus Googles Veröffentlichungen war das der Index eine Größe hätte von 25 Milliarden Dokumenten also ich hab den Angabe eines Blocks der wird das Google zusammen und der diese Größe mit 24 , was Milliarden Einzeldokumenten angegeben worden ist und selbst hat im vergangenen Jahr auch noch mal die Zahl von einer Billion Dokumente aus 10 12 Dokumente veröffentlicht die sind aber nicht im Index sondern die hat der wertvolle erfasst also den Formen von Google hat eine Billion unterschiedlicher Dokumente erfasst die aber nicht alle Index sind aus diversen Gründen werden nicht alles mit den Index aufnimmt und auch viele Dinge quasi 1. außen vor lässt hat auch ein bisschen damit zu tun dass man Suchmaschinen aufpoppte bestimmten Größe dann auch nicht mehr so gut wie keine und die Technik dann doch längere Wartezeiten und ähnliches kommen mit sich bringen würde dazu gibt es da noch mal zu dem wird das sich auf der Oberfläche erreichen kann also das sogenannte so wird dazu gibt es noch das kurz oder die wird das besteht aus Webseiten jetzt entweder nicht nach außen sind die irgendwo in Datenbanken oder dynamischen Anmerkungen Anwendungen verborgen sind zu den es keine Zeit mehr dazu keine anderen Zugänge gibt und das wurde man geschätzt dass das noch 550-mal größer wäre als das dafür aber die Zahl stammt aus dem Jahr 2001 gab es noch keine Zeit also mittlerweile wird das auch wesentlich kleiner sei das hat man dann auch noch später der kleineren geschätzt also das Besucherzahlen damit Sie sich vorstellen können das Ganze ist ziemlich groß besteht ziemlich viel Informationen drin und das Problem ist die einzige Art Art und Weise sich damit zurecht zu finden sind die Suchmaschinen und die Suchmaschinen zeigen uns ja heutzutage schon was die Welt aus wenn sie Information zu versuchen den sie in der Regel zu Google die meisten Leute gehen sowohl also über 90 Prozent dort Suchbegriff A und das was auf der 1. Seite steht das ist die Welt kein Mensch weiß man was steht auf der 2. beziehen dass einige wissen das noch ganz ganz wenige wissen was steht auf der 3. und wenn sie dann weiter nach hinten den sich das langsam auf und kein Mensch weiß was auf der 14. 15. 16. Seite steht weil das sich dann keiner mehr an das wir insbesondere dann kritisch wenn sie einen Suchbegriff eingeben der Wörterbuch steht und sie dann plötzlich 146 Millionen Treffer bekommen die auf mehreren tausend Seiten verteilt stehen und sie sich ja dass schön was da steht aber was steht da eigentlich alles drin das können heutzutage Geschlechts und man kann sich diese Dokumente nicht alles werden dann auch mit sehr sehr großem auf diese Größe generell das bringt einige Probleme mit sich nämlich dass eines wir müssen das ganz aktuell halten bei der Suchmaschinen demnächst spielt und das was die wird von der gefunden haben das Problem ist der fordert auch einige Zeit um das gesamte wird zu durch Vorposten und einen zusammen wenn das überhaupt kann und deshalb kann es es passieren dass Inkonsistenzen auftreten das längst nicht mehr da sind nicht das Muster natürlich bot werden also gibt es einige Probleme auf dem unterstützt und die Frage die sich jetzt stellt als das müssen wir damit oder kann man sehr viel besser und sie
können sich schon der man kann es natürlich besser machen aber dazu müssen wir erst mal die Grenzen noch mal ganz genau aus wo sind jetzt die genauen Knackpunkte der wo können jetzt die Sachen besser machen beziehungsweise wo sind wirklich die Punkte wovon nicht weiterkommen mit den aktuellen Hilfsmittel das heißt uns jetzt die Grenzen des World Wide
Web näher an dazu müssen und dass man
kommt man sieht das Problem noch von 2 verschiedenen sein auf der einen Seite und selbst erstmals Informations Konsumenten wollen die Informationen haben Informationen bekommen dass uns fragen woher würden die richtigen Informationen jetzt ausgerechnet auch für uns wichtig sind unterscheidet Personen-Suchmaschine dass es nicht ich weiß es nicht wichtig dass das dann auch wirklich dann auch für mich wichtig was die Suchmaschine der was wiederum nicht und ich diese Information nicht von der Suchmaschine bekommen wirklich vollständig oder die irgendwo noch mehr ich nicht nachvollziehen kann auf der anderen Seite habe den Informationsanbieter oder Informations Produzent und der möchte natürlich das sei Informationsangebot auch wieder gefunden das gibt diese ganze Wissenschaft der Suchmaschinenoptimierung die dafür sorgt dass sich irgendwie auf die 1. oder möglichst auf die 1. Seite des Google komme womöglich noch ganz oben um auch tatsächlich gefunden zu also das sind eigentlich 2 Positionen die sich sehr gut miteinander vereinbaren lassen auf der einen Seite möchte man Informationen finden auf der anderen Seite nicht gefunden werden möchte man meinen dass das ganz einfach ist aber so einfach ist es eben doch nicht weil nicht jeder der gefunden werden will ist der den tatsächlich suchen also das ist ein bisschen Problem ist natürlich die Frage kann ich dieses Problem der Informations und Suche kann ich das tatsächlich automatisieren objektiv automatisieren und kann ich diese Informationen dann zur kommt auch wirklich trauen mit der Information ist nicht ganz so einfach schon Monster zum Beispiel eine derzeit besitzen etwas ältere Bildzeitung
ganz so alt ist nicht aber es ist schon etwas älter so dass auch wir ein bisschen Schwierigkeiten haben wirklich zu verstehen was da alles drin steht der wird schon einige Vorteile gegenüber der Maschine die versucht das zu lesen also in der Bildzeitung hier beispielsweise sind einige Texte in Form von Grafiken enthalten die müssten jetzt erst oder die sind gar nicht richtig zu lesen von der Maschinen müssten dann erst auch tatsächlich mit Schrifterkennung oder nicht Sachen heraus gezogen und entstehen da natürlich solche Sachen die keine neue Chancen für eine Marie und einigen von uns sagt das vielleicht dass die wir damals bei RTL geguckt haben aber ich möchte man mit in ein 2 Jahren weiß kein Mensch mehr der Annemarie ist ich muss eigentlich auch nicht bis in die Seite ausgeguckt habe und danach gefragt habe und es ist also wirklich gar nicht so einfach zu verstehen was sie wirklich drin steht also was ist wichtig was ist nicht wichtig was es überhaupt Informationen welche von diesem da gesehen ist eigentlich Werbung was bedeutet die Informationen die wir sehen glaubhaft ist die Information dass es insbesondere interessant der bei der ein Bild das gehört zusammen das schon etwas einfacher zu entscheiden und was es redundant was steht schon irgendwo an anderer Stelle der Mensch selbst kann diese Aufgabe ganz gut bewältigen der der Mensch hat Kontext ist der weiß oftmals in welchem Zusammenhang die Sachen stehen der kann beispielsweise auch schon das Bild das sich von den Fußballer mit der Überschrift in Verbindung bringen und weist den steht Figur zu Bayern wird es sich bei um als Fußballspieler handeln und bei Bayern und wahrscheinlich einen Fußballverein werde jetzt mal anderer Großörner Fahne von der SPD und der Herr Müntefering abgebildet ist schon etwas schwieriger wenn wir diesen würden Diego zu Bayern also das ist sehr sehr viel Kontext wissen notwendig und dazu auch noch Wissen über die Welt an sich um diese Sachen korrekt interpretieren zu können und das macht also wirklich schwierig diese Information zu deuten und und diese Information wird ankucken ist die codierten Marktabsprache hat
und hat das wissen Sie alle hat sagt uns die Informationen dargestellt von strukturiert werden sollte und die Information über Links miteinander verknüpft werden so aber HTML-Seiten natürlich nicht was die Information eigentlich bedeutet die da drin steht und die Bedeutung dieser Informationen und trotz der für die Semantik die kann ich also nicht damit ausdrücken sondern die muss ich mich mit Hilfe jetzt wieder meines Kontext Wissens und meines erlernten Wissens als Mensch quasi erschließen beziehungsweise eine Maschine muss er gehen muss mit Hilfe linguistischer Verfahren oder statistischer Verfahren versuchen die Bedeutung zu schließt dazu müssen uns den Semantik Begriff als erstes ein bisschen genauer angucken was versteht man das Amt Semantik kommt aus dem Griechischen Begriffs in manchen Kost bedeutet zum
Zeichen durch beziehungsweise die bedeutungsleer von diesem an an sich ist ein Teilgebiet der Linguistik der Sprachwissenschaft die sich mit und Bedeutung von Sprache oder von sprachlichen Zeichen befasst die Hauptfrage sich dabei die Semantik stellte ist wie kann ich sie und Bedeutung von komplexen Begriffen aus dem von einfachen Begriffe ableiten das heißt ich das ganze Problem des Verstehens wird heruntergebrochen eigentlich auf ein syntaktisches Probleme als heißt also wir stützen uns dann beim Verstehen des Semantic oder beim Abarbeiten der Semantik bei bestehender Bedeutung auf die die Regeln der Syntax und die Syntax ebenfalls griechische Begriff Syntax ist dass es steht für Zusammenstellung Satzbau und die normative Struktur der Daten also Syntax ist klar wir alle die wir schon mal und formale Sprachen hatten die Syntax und was ich kann mir Syntax mit Hilfe einer Grammatik die mir genau sagt jetzt Zeichenketten aufgebaut werden können die Politik sind innerhalb einer Sprache und die Semantik das sind dann die Regel die und sagen wie ich diese Zeichen den sinnvoll miteinander kombinieren und anwenden kann einfaches Beispiel Syntax und Semantik das auseinanderzuhalten schon aus dass man mir eine Formel stehen 3 müssten wir gleich Prozent wenn das jetzt mathematische sein soll dann ist das die ziemlich Quatsch von den Zeichen der gesehen dass es also Schumann syntaktisch Fall bereits das 8. 23 dass es jetzt syntaktische richtig weil wir haben hier Zahlen stehen Pluszeichen und ein ist gleich dazu das ist sehr sehr schön Addition das Ergebnis ist allerdings falsch also die Bedeutung stimmt nicht besser ist es eigentlich falsch aber syntaktisch richtig und ich schreibe 3 bis 8 ist dann ist sogar syntaktisch und semantisch richtig also Nummer zu unterscheiden was ist praktisch was ist ein Mann ist das die Bedeutung des ganzen werden die Syntax nur die Regeln gibt nach gültige Ausdrücke konstruiert werden durch Anfrage ist jetzt ok für die Probleme Schmarrn geguckt diesen gibt es das ist das Ende des wenn wir wissen das World Wide Web
ist spezialisiert auf Dokumenten sind der Verarbeitung und nutzen soll das Ganze der Mensch und nicht Maschinen und dort gibt es wirklich einige Problemfelder oft nicht mal kurz ein bisschen mehr eingehen möchte bei den mit den Standardverfahren nicht mehr weiter kommen bei den unbedingt Semantik und und Präsentation von Semantik brauchen sonst können wir diese Probleme nicht lösen das erste ist die Informations zu suchen Sie kennen das Ganze bei Google wenn sie Informationen suchen die sie zu
Google Google Googles eine sogenannte Schlüsselwort basierte suche das heißt sie geben ein Suchwort dazu Ergebnisse von Dokumenten die genau diese Suchwort erhalten enthalten Problemen bei der Suche so man sie geben Golf der woher soll Google wissen ob es jetzt das Auto mal auf die Sportart meine oder ob sie den Golf von Mexiko mein als ein geographischen Problem ist ist die sogenannte Homonyme das sind Wörter die werden gleich geschrieben haben aber unterschiedliche Bedeutung und die können auch in unterschiedlichen Kontext der unterschiedliches bedeuten und das können wir anhand von einem Wort nicht entscheidend ist das jetzt eine ganz bestimmte Bedeutung sondern da muss man mit anderen Mitteln nachfragen oder ähnliches versuchen die Bedeutung aus dieser Mehrdeutigkeit herauszuholen und das Ganze dann die GUI das ist ein ganz wichtiges Problem innerhalb der Semantik dass man versucht die Bedeutung eines mehrdeutigen Begriffes zu erschließen aus dessen Umfeld Suchmaschine können dass ich die wir uns jetzt alle Dokumente liefern die jetzt den Begriff Golf enthalten und das natürlich Golfspielen dabei dass das Auto dabei und das auch noch der Golf von Mexiko mit der also wir haben wir schon Schlüsselwort basierten suchen sehr sehr viele Rauschen mit drinnen oder ungenaue Ergebnisse die deutsche und nicht relevant ist auf der anderen Seite muss sich jetzt fragen ja wenn nicht Golf eingeben König nicht wirklich bei dieser Abfrage alle Dokumente zurück die mit Golf wenig beispielsweise jetzt das Auto im Blick haben die mit dem Golf zu tun haben aber nicht so Frage als das eigentlich das ist eine rhetorische Frage ich kriegsähnlich zurück warum ich Kriegsfalle zurück in dem der Begriff Goldvorkommen aber das kann natürlich auch Dokumente geben die sich mit dem Golf beschäftigen aber niemals nennen gut dass es jetzt dieser aber es könnte auch so sein dass man beispielsweise in anderen Sprachen einfach andere Bezeichnungen hat oder die Wörter übersetzt wurde schon oder USA bei seiner von wieder ist das der wird also genauso wie der wieder vor Käfer der Frage wie bei biete und der VW Golf der ist mit dem englischen also würd ich jetzt nur deutsche Dokumente finden zudem VW-Golf aber ich würde keine zu der US-amerikanischen oder englischen Variante zum werde das bedeutet also es gibt natürlich Wörter deren Bedeutung ist gleich aber das sind unterschiedliche Wörter also Golf und oder bietet und Helfer oder haben sehr sehr viele Beispiel also alle Synonyme die sich vorstellen können dass sind unterschiedliche Wörter haben aber gleiche Bedeutung und genau das findet natürliche Suchmaschine auch nicht wenn sie Schlüsselwort basiert ist weil sie immer nur exakt nach vorkommen dieses einen Tanz nicht eingegeben sucht Synonyme als und um klarzumachen was man meint müsste man quasi die Bedeutung und über die Bedeutung dann sämtliche mögliche Synonyme erschließen zu können und dann exakt danach suchen zu also das ist ein relativ schwierig werden uns bei der Suche haben wir sogar mehr das Problem das sprachliche linguistische Eigenschaften Mehrdeutigkeiten beziehungsweise sich auch Mehrdeutigkeiten von einzelnen Wörtern und Mehrdeutigkeiten von Begriffen und Bedeutung haben dazu dafür sorgen dass auf der einen Seite unvollständige Informationen haben aber auf der anderen Seite auch zu viele nicht relevante Informationen haben also es kommt Rauschen aber es wird zuwenig genau oder sorgt für die Ungenauigkeiten Problemfeld zwar ist das Herausfiltern von Informationen
Informationsextraktion unter gelten genau dieselben können sich da nicht auch Probleme bei Union und deren Bedeutung zu erschließen dort habe ich wirklich da brauche ich Kontext wissen da brauch ich Weltwissen um die Bedeutung von bestimmten Begriffen tatsächlich verstehen zu können das heißt ein Mensch menschlicher den wir gerade hatten der ist in der Lage das zu verstehen weil der richtigen Zeit geboren ist weil er genau weiß auf welche Zeit sich diese Aussage die ich nicht bezieht und welchen Kontexten steht ein Soft bergend oder ein Programm hat das Problem muss man das alles erst mal sagen damit das überhaupt verstehen kann das wirklich explizit vollständig zu machen ist ein bislang ungelöstes Problem des Weiteren steckt in einem Seite mit zur Text 6. implizite Information das heißt die sie das Wissen das nicht explizit wortwörtlich ausgedrückt ist sondern dass wir
auch erschließen können weil wir ein bestimmtes Weltwissen haben müssen über die Welt und dadurch könnte logische Schlussfolgerung ziehen und am können anhand dieser logische Schlussfolgerung damit unser Handeln oder das was wir tun wollen beeinflusst dieses Ziel von logischen Schlussfolgerung dass keine Maschine erst mal auch nicht sie kann also nicht auf dieses implizite wissen zurückgreifen sondern müssen 2 explizit machen oder müssen wir beibringen wie das funktioniert das sich durch logische Schlussfolgerung implizites Wissen explizit machen kann auch ein wichtiger Punkt und dann später bei Logik und Schlussfolgerung der Wissensrepräsentation noch mal kucken werden aber das geht im Moment auch ich weiter das Problem Problemfeld wäre die war das ist eigentlich relativ einfach zu verstehen denn je größer eine
solche Informationsbasis wird desto schwieriger wird sie zu warten erst mal gibt es Probleme mit der Konsistenz versicherte Nummer Yahoo abgebildet war dass es warm war ursprünglich ein von Hand gepflegt der Index der dann irgendwann so groß geworden ist das man wirklich Probleme hatte den zu pflegen und es gab syntaktische Konsistenz die relativ einfach zu erkennen sind also die syntaktische Inkonsistenzen heißt das einen Link nicht mehr gültig ist also dass das Zieldokument auf das das linke Seite umbenannt worden ist oder nicht mehr vorhanden ist derzeit das Link ins Leere und ich krieg einen HTTP-Header zurückgeliefert dass ist syntaktische Konsistenz die kann ich automatisch feststellen und entsprechend beheben auf der anderen Seite nämlich eine semantische Konsistenz habe ist das nicht mehr so einfach 1. überhaupt zu erkennen dass semantische Konsistenz vorliegt ich wieder 2 Dokumente sind über einen miteinander verbunden und jetzt hat sich der innerhalb des Zieldokumentes verändern waren werden das zeigt auf die Webseite unserer Vorlesung und den Inhalt runtergenommen und auf der Vorlesung wäre hätten wir jetzt Berichterstattung zu werden wie Gold der Sportart hätte nichts mit der Vorlesung zu tun das Land wird aber immer noch da jetzt müssten die automatisch im Zuge der Beratung erkennen dass das Halten von der alten sollte die jetzt auf unsere Vorlesung explizit verweist nicht auf der Seite zeigt es wirklich mit unserer Vorlesung zu tun hat das heißt wir müssten auch wieder feststellen dass sich die Bedeutung geändert hat dazu müsste für die Bedeutung erschlossen werden können oder sie müsste formal spezifizierten und das ist das Problem dass solche semantischen Konsistenz überhaupt festzustellen man sie festgestellt hat sogar noch zu können und das ganz automatisch also das wird in nächster Zeit nicht möglich und Problemfeld 4 ist die Personalisierung der wird wurde
in den letzten Jahren auch schon sehr sehr viel mehr investiert insbesondere von Suchmaschinen oder auch von Online-Shops wie beispielsweise dieser sehr früh angefangen haben mit der Personalisierung der geht es nicht dass man versucht den dargestellten Information Inhalt einen persönlichen Bedürfnissen Anforderungen des jeweiligen Benutzers festzumachen Suchmaschinen machen das in der Regel ganz einfach weil man einen Google-Account hat also einen Kunden Account dann kennt die Suchmaschine einen normalerweise insbesondere dann wenn man seine kommt es auch immer schön aktiviert hat und dann kann die Suchmaschine natürlich immer sind bei jedem jeder suchen die nicht durchführen welches Ergebnis willigten aus aus der präsentierten Ergebnis lässt und das merkt sich natürlich die Suchmaschine lockt Daten und dementsprechend wird das mit in einer zukünftigen suche dann eventuell verändert das ist auch der Grund dafür ist das schon mal festgestellt haben warum habe ich dann auf einen Suchbegriff eine ganz andere Ergebnisse ist als mein Nachbar der vielleicht auch einen Google-Account hat und ganz andere von hat also das ist das Problem wenn man personalisierte Suche bei Google mit einem Benutzer oder mit einem länger aktiviert kommt betreibt dann sind zwar unabhängig voneinander durchgeführten suchen die führenden nicht notwendigerweise zum selben Ergebnis weil das ganze Leben schon personalisiert aber das Problem ist ja auch wieder ja woher weißt überhaupt jetzt das System ob das was ich hier ausgesucht habe ob der Kontext immer derselbe ist und ob die Absicht Zielsetzungen einmal wenn ich versuche diese ist also ich vielleicht das eine Vorlesung an sich was für meine Freizeit gar nicht ganz unterschiedliche Zielsetzung solche Sachen auseinanderzuhalten sind natürlich sehr sehr schwer das kann die Suchmaschine rein statistisch erst mal gar nicht machbar und da natürlich auch toll das ganz so semantisch formale auszudrücken damit die Suchmaschine auch weiß aber das ist derjenige und der Sucht nach diesen und jenen Kriterien wobei die Suchmaschine natürlich nicht wissen muss das ist ist sondern nur den Kriterienkataloge nachdem gesucht werden soll wissen muss das reicht der der schon also auch noch keine Angst haben dass man durch solche Semantik Technologien bei den Bedeutung wirklich ist formal ausgedruckt wird dann noch diverse durchsichtiger wird sondern es geht sogar in die andere Richtung ist geht weg von zentralisierten Diensten zu ganz zentral Diensten wobei man immer selbst Herr seine eigenen Daten bleibt und nicht mehr solche zentralisierten Gebilde entstehen wird beispielsweise diese ganzen Social Networks intuitiv ist Druck und sonst was die jetzt als starke eigene benutzt Daten aus der ganzen Welt von allen möglichen nutzt sammeln registrieren und sich natürlich vielleicht auch eines Tages gegen unseren Willen verkaufen also das kann sich dann oder das ist auch einer der Gründe warum es das ganze vielleicht auch so zu wenig durchsetzt weil man dann wieder selber über seine Daten des und das den für das ganze unterstützen würden die die Forschung dann natürlich auch nicht so Entgegenkommen dass auch interessante Geschichte dass ich auch mal warum Google hat auch mal gesagt dass man die Daten die wir was werden das was die nur mit der der Vizepräsident von von Google gesagt hat dass 2 Tausend 5 2006 auf künstliche Intelligenz Konferenz gesagt hat dass wir hatten den Keynote gehalten haben und hat das Duo natürlich über das Semantik gebildet hat gesagt dass das die Zukunft sein wird und es geht nur mit aufgefischt bei der Frage Fragerunde und hat gesagt das glaubt ich also glaubt dass man die wird niemals eine Chance haben wir wollten wir könnten das sagen weil die Benutzer bei Google hatten ja dass sie noch nicht mehr in der Lage sind HTML-Seiten richtig zu schreiben wie sollen dann dieses diesen ganzen Wust von Sprachen nicht gerade vorgestellt habe richtig beherrschen damit dass dann auch wirklich korrekt nächsten kodifiziert ausgedrückt formal repräsentiert wird das glaubt das nicht aber dass das bisschen kurzfristig gedacht worden dass Google heute seinen Kurs schon ein bisschen revidiert hat und in andere Richtung auf zusammenfassend das World Wide Web ist generell für die Nutzung
durch den Menschen bestimmt und automatisch die heranzukommen an die Information die drin steckt die weiterzuverarbeiten ist schwierig dafür müssen wir die Bedeutung der Information quasi Hilfe standardisierter Formalismen darstellen kann es muss ein Formalismus seien das heißt es muss maschinenlesbar seien mit dem Programm etwas damit anfangen können und das muss natürlich auch einen Standard geben damit das ganze wie interoperablen wird damit die unterschiedlichsten Plattform miteinander zusammenarbeiten können also einen standardisierten Formalismus zur Repräsentation von an und das 1. was wir dazu brauchen sind Daten über unsere Informationen Daten über Daten also das heißt Metadaten in dem Fall mit erwarten sie nichts anderes als strukturierte Daten mit deren Hilfe man jetzt Informationsressourcen Dokumente beschreiben kann womit die besser auffindbar gemacht werden und in unserem Fall von sogar so genannte semantische Metadaten das heißt mit der Daten und die Bedeutung der Information die beschrieben werden soll festgemacht wird und formale dargestellt wird sage ich was passiert wenn das Ganze den tatsächlich also Division bis
an die dazu müssen wir eigentlich auch noch ein paar Jahre zurück weil sie so neu ist die Idee eigentlich nicht von selbst auf den Erfinder des World hatte eigentlich Ursprung nicht ganz andere Designgold aussehen sollte also hatte
schon vor über 10 Jahren geschrieben nur aus Design das Menschen ist wurde durch Tschüss Yussef wo jetzt kommt zum Mord und von jungen jungen kommen mit chemischen also nicht nur für menschliche Kommunikation Bad aus oder schien zu tun hat diese Welt unter also das heißt dass auch Maschinen Programme sind an dieser Kommunikation teilnehmen können und unterstützen aber damit Maschinen tatsächlich helfen können Programme helfen können müssen Sie natürlich verstehen worum es bei dieser Kommunikation geht das heißt die Information muss Maschine gelesen und korrekt interpretiert korrekt interpretiert heißt müssen zu verstehen ist wo man sich fragen wie das funktionieren kann werden wir gleich mir das noch mal ganz kurz Blick in dieses allerersten auf und dann das 1989 den
wir vom Menschen Management All-purpose erschienen und und und und 80 im März bestellen auch die und Material mit einem können sich das Dokument mal gucken und man sich das also quasi schon ein Dokument Netzwerk entworfen geteilt allerdings aber hat die einzelnen links die sie die hier die kann in diesen Graphen bilden hatte selbst noch Begriffe beschrieben wie beispielsweise das Kreuz Clouds folgsamen und solche Sachen oder sonst wo das heißt er hat den Link sind auch noch eine Bedeutung gegeben dass man so genannte typisierte und das ist in der eigentlichen Umsetzung der 1. hatte und hatte Umsetzung wieder fallen gelassen worden weil das wäre alles viel zu kompliziert geworden dass dann auch noch die formale bis zum Sommer hat diese ganze Beschriftungen längst weggenommen und damit die Bedeutung und an die verloren die einen sagen das ist der Grund dass es so einfach war dass es sich so gut durchsetzen konnte die anderen sagen das ist der Grund warum willst das Semantik und nochmal quasi noch ob es noch sitzen müssen könnte man von Anfang an schon richtig gemacht hätte man glaube ich von Anfang an andere Wege beschreiten ok aber die wir zurück zu unserer eigentlichen Frage wie kann ich den jetzt die Bedeutung der Information der Webseite verstehen Suchmaschinen versuchen das schon gibt es also die wollen natürlich verstehen was steht Text wollen dann entsprechend Antworten zu suchen Begriffen wie das heißt Suchmaschinen folgen eigentlich hier der Technik die auf der rechten Seite auf der
linken Seite dargestellt wird man nicht mehr das ist also der wird mit Hilfe von statistischen und linguistischen Verfahren versucht auf die Semantik zu schließen und versucht aus einer Text Vorsicht man versucht über Statistik Worthäufigkeiten welche weiterkommen häufig miteinander zu man versucht dann festzustellen welche Werte sind die benachbarten welche Bedeutungszusammenhang stehen sie damit versucht man die Semantik automatisch zu erschließen und hat damit immer nur ein also zumindest eine andere Möglichkeit wäre um Inhalte der Maschine verständlich zu machen wäre das man nicht mit uns sagt man hat Texte die man versucht deren sie meinte man versucht zu erschließen sondern versuchen neben dem eigentlichen Text Informationen stehen zu haben zusätzlich noch eine Datenstruktur hineinzustellen in der die Bedeutung maschinenlesbar kodiert ist das heißt das Personal Wissensrepräsentation eine logische Formel oder was auch immer mit deren Hilfe eine Maschine verstehen kann was da tatsächlich gemeint ist und das nichts anderes als so genannte semantische Metadaten also man versucht natürlichsprachlichen Inhalte explizit zu anderen Tieren mit Hilfe sogenannter semantischer Metadaten macht die Bedeutung explizit und stellte neben der diese semantischen Metadaten die tragen die Bedeutung der Inhalt und die lassen sich maschinelle lesen und korrekt interpretiert dahinter steckt eine sehr sehr schwierige Aufgabe also immer wieder zurück gucken zu unserer Zeitungsseite um
herauszufinden was tat tatsächlich steht und was sich dahinter verbirgt muss man aus dieser Überschrift als 1. Mal Text aussehen kann man das wie ein Bild beispielsweise kodiertes muss man das bei den Text gut zu Bayern dahinter ein Fragezeichen extrahieren und man normalerweise muss erst mal wissen was ist denn hier welcher Wortbestandteil ist was das heißt man muss auch eine den einzelnen Wortbestandteil Entitäten zu ordnen wir beispielsweise die gut das ist dieser Fußballer von Ost und ja oder wir das ausspricht das ist ein Fußballspieler Fußballspieler dass ist eine Person das muss ich explizit machen das muss sich wieder zu schreiben und sondern die rechte Seite dazu kommt doch ein bisschen auch ein Objektorientierte Programmierung werden eine Instanz einer Klasse dieser Klasse einer anderen Klasse ist also Fußballspieler ist so Klasse von der Klasse Person und eine Instanz der Klasse Fußballspieler ist hier unsere bekommen das muss ich es nur auf geeignete Art und Weise ausdrücken und das wie man das macht das wird mir Semantik gezeigt dass es schon
relativ alt und 97 auf das World Wide Web Konferenz bis Australien wurde als 1. mal diese Vision des so genannten Lohmühlwiesen war das ist nichts anderes als dass man die vorgestellt dass man das aus dem wir auch machen könnte das wurde aber steht verfeinert dann ein Jahr später zur Semantik verboten der dann auch gezeigt worden ist man das jetzige wird in einer Konzeptionsphase zu einem Semantik führen aber dazu müssen erst noch mal genau klären was ist ein Mann der was kann das einzige was kann es nicht und jetzt endlich wird unser Leben verändern oder nicht das einzige selbst ist eigentlich ganz einfach erklärt und diesen schönen Satz der nicht aus einem
Artikel aus dem Scientific American stammt von Kindern ist die Chance Händler und war das verlangt dass man heißt der Titel einfach und damit definiert dass man wird es zunächst schon auf bekommen als Erweiterung des vom aktuellen World Wide Web wird vom Menschen ist gewinnen weil fallen in dem Informationen eine wohldefinierte Bedeutung zugeordnet wird später in den Computer sind die Kultur Corporation damit nicht Menschen und Computerprogramme weil zusammenarbeiten können oder besser zusammenarbeiten können dass es auch nur relativ hohem Abstraktionsniveau dargestellt was ist das Wasser letztendlich nur mit drin steckt ist folgendes dass das jemand wird nichts anderes ist also eine Art globale Datenbanken
Universalisten semantische Aussagen nicht alle miteinander in Bezug setzen und das Herz wird es ja dann aus diese Datenbank wenn diese Daten sowohl von Programmen als auch von Menschen ausgetauscht und auch gemeinsam verarbeiten können und der Trick oder das schöne was dabei entstehen kann dass man hätte und Daten Struktur und Datensätze ist natürlich über das verteilt gibt und die eigentlich nicht so richtig zusammenpassende dass man diese hätte umgeben Daten weil man sie nicht verstehen kann als dafür formale Repräsentationen gibt was die bedeutende kann man die verstehen und damit sie interoperabel und austauschbar und das auch an einem Punkt der auch Moment aktuelle sehr sehr spannend ist nämlich bei der so genannten Daten Integration mit der es möglich mit Hilfe Semantik Web-Technologien hätte Datensätze zusammenzubringen und gemeinschaftlich zu verarbeiten sowie man vorher nicht für möglich gehalten hat das geht mit so genannten lenkt später den Truppen der Technologien die wir uns hier in dem Rahmen auch noch mal näher anschauen das Semantic Web letztendlich stellt die 3. Generation da das Internet ganz am Anfang Rechner der
Verarbeitung dann Dokumenten sind wird der Verarbeitung und jetzt haben wir datenzentrierte verarbeitet also das einzige ist nichts anderes als ein wird oft etwa kann man sagen bei dem die Bedeutung der Information Soldaten die das Licht durch standardisierte Wissensrepräsentation sogenannte Ontologie formale explizit sichtbar gemacht werden und angegeben wird dann wird es möglich die Bedeutung der Information Maschine zu verstehen unterschiedliche darum geht mit der Bitte um Daten miteinander Bezug zu setzen und in letzter Konsequenz dann auch noch implizit also nicht offensichtlich Informationen aus vorhandener offensichtliche Informationen zu schlussfolgern so dass man am Ende sagt das Semantik Web ist nichts anderes als eine globale Datenbank über gesagt haben als das ein universales Netz semantischer Aussagen bereithält und mit dem ich arbeiten kann aber wie komme ich da dazu gab es diese Semantik vertraut sollen vierstufigen Plan
aufgestellt hat mit quasi Staat die ein bisschen mehr Semantik quasi bereithalten ganz unten auf der Stufe stehen jetzt Vorstand war schon länger da stehen ganz normale Textdokumente HTML-Dokumente die war schon immer hatten Lust Datenbankeinträge die Daten die sind voll proprietäre haben das Problem beispielsweise wenn sie aber so vergleichen und Google Google hat natürlich wo drangen sicherlich Datenbanken wächst und Amazon hat sicherlich auch eine Datenbank stehen aber die Daten an sich untereinander nicht oder Betrachter aus der Datenbank die sind schwer miteinander zu kombinieren oder in Einklang zu bringen das Problem ist dass ich die Bedeutung der Daten in den Programmen steckt die darauf zugreifen und nicht in den Daten selbst zu dass sich mit den Daten allein nur wenig anfangen kann das ist mir so also der Katalog von am also der Index bei Google oder der Datenbestand die kann ich nicht miteinander kombinieren weil die Daten anwendungsbezogen proprietäre sind und die Semantik der Daten in den jeweiligen Anwendungen nicht in den Daten steckt eine Stufe weiter wenn ich gehe da betrachtet den XML-Dokumente die mit einem einheitlichen Vokabular erstellt worden sind das ist dann der Fall wenn ich nicht vorher mit einem Kommunikationspartner darüber verständigt habe passt auf ich benutze XML Vokabular und ich ab dabei beispielsweise Adressen und meine Adresse hab ich einen Vornamen und einen Nachname und das bedeutet dass das oben ist der Vorname und das was danach kommt das sich also das Element ich einen ganz bestimmten Titel das ist der Nachname und dessen dieser Art und Weise zu interpretieren dann hab ich schon ein bisschen mehr Semantik quasi auch die Daten reingesteckt also ich hab ich weiß zumindest die Daten strukturiert sind und ich hab mich mit meinem gegenüber über diesen Mann die dieser Daten vorher ausgetauscht und dann können 2 unabhängige Anwender die sich vor über die Semantik der Daten ausgetauscht haben die mit Hilfe oder auf der Basis von XML-Dokumenten Austausch dass es also die 2. Stufe gemeinschaftliches Vokabular das der Fall wenn die nächste Stufe obendrüber da hat man dann 2 Vokabular die nicht mehr so ohne
weiteres zusammenpassen also 2 verschiedene Vokabular versucht zusammenzubringen mit einer Sprache die drüber liegt mit der Taxonomie hier beispielsweise als eine Taxonomie dass es eine Hierarchie strukturierte Datenstruktur die also sagt was ist so oder Teile von einer anderen Klasse also hierarchisch strukturiert und dadurch kann ich quasi Format 2 verschiedene Vokabulare gut miteinander in Bezug setzen also wenn ich jetzt beispielsweise auf der einen Seite ein Vokabular habe das Fußballer beschreibt und auf der anderen Seite Vokabulare das Studenten beschreibt jetzt aber Taxonomie hat es gegeben habe die sagt Studenten sind Personen Fußballer sind auch Personen dann kann ich zumindest sämtliche Dinge die auf Personen zu treffen Aufbau von diesem Datensätzen einen Namen daher eine so genannte Taxonomie mit solchen Klassen Beziehungen die helfen wird aber also hier hab nicht als Beispiel Semantik ist eine Vorlesung eine Vorlesung ist der Veranstaltung das ist Taxonomie oder taxonomische Darstellung oder Hans Mustermann gehört zum Hasso-Plattner-Institut das Hasso-Plattner-Institut gehört zur Universität Potsdam mit solchen Datenstrukturen kann ich schon 2 unterschiedliche Vokabulare miteinander in Bezug setzt das ist aber noch nicht genug was ich möchte ich möchte wirklich gibt die das Wissen explizit macht mich
schlussfolgern und dazu muss ich noch eine Stufe würde ich braucht so genannte echte Ontologie mit denen die nicht wirklich dann logisch miteinander in Bezug setzen kann und aus denen ich neues Wissen generieren kann das macht man dann mit der darauf aufbauenden Sprache mit aus der Welt und Rollenspiele und durch die Anwendung dann von Schlussfolgerung es den auf diese Wissens Strukturen diese Wissensrepräsentation die stark und damit kann ich dann beispielsweise automatisch Dokumente aus einer Domäne in eine andere übersetzen ich kein komplexe Abhängigkeiten zwischen einzelnen Objekten der und das geht so weit dass man sagen kann die Anwendung versteht die Daten bei den Daten selbst auch deren Bedeutung formalisiert niedergelegt worden ist also der ganze wie wir gesehen haben den macht nichts anderes als die Semantik der Daten die Bedeutung der Daten aus den Anwendungsprogrammen rauszuholen und explizit quasi zu den Daten zu stellen damit ein Anwendungsprogramm von außen kommen Kandidaten verstehen kann und weiterverwenden kann genau den sind die der Benutzer des Anwendungsprogramms vor sich das ist der Trick der dahinter steckt man muss die Semantik aus dem Programm rauskriegen zu den Daten stellen damit da eine bis zur Unabhängigkeit gewonnen werden kann und die Daten quasi auch für sich alleine stehen können und verarbeitet werden könne man das Ganze dann hat muss man sich fragen ja kann nicht in diesen Daten überhaupt die die Trauer und da sind wir dann beim Problem des so genannten wird oft
fast so ist der mutmaßliche Autor einer von welchem Daten ist es auch der tatsächliche Autor so muss die sichergehen dass die Authentizität gewährleistet ist man muss sich gehen dass die Daten nicht zwischendurch manipuliert worden sind und dann wird man dann sollten sie sich erkennen Techniken der Public Key Kryptographie an also beispielsweise digitale Signaturen und und dann letztendlich kann man sagen ist ein semantisches Dokument nichts anderes als eine Sammlung von semantischen Aussagen bloß noch die zugehörigen Signaturen mit denen ich nachweisen kann dass diese Aussagen nicht verändert worden sind und dass diese Aussagen von ganz bestimmten ueber Widerstand zu den ich einen irgendwie quantifizierbar das oder nachweisbares Vertrauen was brauch ich dazu um was zu entwickeln das ist der Werkzeugkasten für das Semantik also das spielen sehr sehr viele
unterschiedliche Disziplinen aus der Informatik hier dieses Antikörper mit Ihnen also beteiligen sich die sich natürlich die Künstliche Intelligenz also Logik ist auf jeden Fall mit dabei und logikbasierten Sprachen wie schlussfolgere ich und ich denke dass sich die machen dann kommt die Computerlinguistik dazu die Kryptographie aber gerade gesehen Datenbanktechnik ist dabei beteiligt Theoretische Informatik Rechnerarchitektur Software-Ingenieur Systemtheorie Computernetzwerke also jeder findet Design kann der Hansemann die etwas beitragen kann und die Anknüpfungspunkte sind und sein werden und das werden wir noch weiter aus hier schon wieder weg von der Architektur des von bisschen zusammengequetscht des
Architekturbilder können Sie sich noch daran befangen und bei wurde ist bei Kindern zu er erst dann kommt hier der Ontologie der mit der und Kontrolle mit AOL wird es den Regeln der ist wohl 4 plus der Abfragesprache Debakel und dann sehen sie kommt hier so spricht was so soviel bedeutet wie sie umgibt schon Standards alles was oben drüber ist ist noch nicht standardisiert und belegen die sogenannten Logik der den Logik passierte Systeme zur Anwendung kommen und ganz oben sind Sie unter dem fast leer und der fast leer ist dafür da dass sich aufbauend auf kryptographische Verfahren Authentizität und Integrität von diesen semantischen Daten nachweisen kann dass so lange Jahreszahlen bestimmte Standards standardisiert worden sind und im Moment sieht das so aus dass bis dahin wo dieses orangefarbene Teil
greift Standards bis oder
existierende Standards vorliegen AOL hatte ganz neuen aus 2 gibt es seit einigen Monaten ganz neuen Standard das Wohl der Format ist noch nicht voll aus spezifiziert es noch Standardisierungsbehörde verpasst schon komplett standardisierte von man darauf schon wieder diskutiert ob man diese Abfrage noch neue Techniken wie mit 3 und das Ganze noch ein bisschen komplizierter zu machen ist das nicht so schlicht Kuchen also nicht nur lecker sondern man kann das auch ein bisschen komplexe interpretieren hier sind die einzelnen Sprachen und Spezifikationen auf der
einen Seite und auf der anderen Seite dazugehörige Konzepte und Abstraktionen also dass wir hier unten oder man die basiert alles auf dem der auf der Plattform in der auch hier Techniken URIs HTTP Juni Kurden Autorisierung Szene mit festgelegt sind dann kommt der Reihe von Formaten x sollte hat am meisten von uns usw. und dann aber auch Informationsaustausch noch mit dran also dieses wenn wir uns noch in Zukunft kann man zu Gemüte führen um die Dinge die wir kennen lernen einordnen zu können wo in diesem nur für Kunden die Sachen die wir jetzt gerade machen denn eigentlich ganz wichtig ist diese kleine sorry an der Seite die steht für die so genannten lenkt später liegt ist wirklich ganz ganz kleiner Teil dessen was das man die ausmacht aber es scheint sich im Moment abzuzeichnen dass das genau der Teil ist der dafür sorgt dass es sich auf breiter Basis durchsetzen könnte den da sind genau diese Prinzipien vereint wo es darum geht Daten die schon jetzt vorhanden sind die strukturierte Daten in welchen Datenbanken stehen Semantik drüber zu holen also dass man für die Fiktion oder nach hat zu übersetzen damit sie mit anderen Daten Bezug gesetzt werden können Daten angefangen mit einem der bekannten großen Lexikon nicht mit der Wikipedia indem man die geholt hat als die Wikipedia und die dann quasi als generell das Grauen oder als keinen Punkt eines ganzen Nucleus von Netzwerken von einzelnen großen Datensätzen wieder dranhängen gesehen werden kann das dann so eine große Delta klaut zu Wolke werden und dann auch noch einen schon damals noch der Spaß Abfragen zu machen dann zum Navigieren und Informationen zu suchen und miteinander in Bezug zu sein was wir noch nicht geklärt haben das was das man sich nicht es dass man den Wert hat nur relativ
wenig mit künstlicher Intelligenz zu tun weil die Sprachen die Semantik wird zum Einsatz kommen die haben noch relativ wenig Ausdruckskraft das sehr einfachen Beschreibungssprachen und die den eigentlich hauptsächlich dazu untereinander austauschbare Daten zu formulieren und einfach möglich gegen einfache Möglichkeit Aussagen zu treffen also da nur ganz ganz primitives schlussfolgern möglich und diese Bandbreite beispielsweise Prolog oder eine andere haben was der Programmiersprache bietet oder vollwertige Prädikatenlogik das habe ich damit nicht das was Ziel bei der Entwicklung des Antikörpers wie schon so oft also gestellt von wohl dass man die bis zum KIT längst wird dies durch den 1. es sich absolut kompletten ist dass man versucht möglich einfach zu machen so dass man auch eine Chance hat das irgendwann zur Anwendung nicht Teil des antiken jetzt noch in naher
Zukunft sind zudem die assoziatives schlussfolgern räumliches Denken Erkennen von Bildern Gesten Texten komplex Entscheidungsprozess von schlussfolgern aus unvollständigen oder kontextabhängige Information alles was jetzt je zur starken zur vom hatte technischen also auch kein Problem weil ich kann natürlich Anwendungen die das tun auf den Daten aufsetzen lassen sich so man habe das ist gar kein Problem wenn die Daten formal explizit für Semantik spezifizieren kann ich damit natürlich was machen das ist zwar nicht Teil des Semantic aber ich hab doch die Möglichkeit das damit zu tun und die letzten Minuten werden wir uns mal anschauen wie das Semantic Web jetzt tatsächlich eines
eingesetzt werden würde die Welt verändern kann man mit dem Beispiel der Suchmaschine waren
angegeben einen einfachen sucht dringend im Golf von 2000 bis wissen wir auch nicht genau was man damit nicht oder was dem Benutzer damit gemeint hat und auch die Suchmaschine muss irgendwie muss versuchen zu disambiguiert das Ganze natürlich erst mal noch nicht so richtig bei dieser kurzen Eingabe also wird es wahrscheinlich den Benutzer Benutzerfragen ja was eigentlich gemeint Piccadilly Sportart oder sonst was es gibt es sein kann
dass er schon ab dem 1. Teil der Frage kann ich damit schon verstehen und zuordnen aber die Anfrage nach der steht noch 2000 also endlich mal was hab ich dann noch Informationen einer
Wissensrepräsentationen zudem Gold als Autor und habe ich beispielsweise stehen das ist ein Auto das Baujahr das hat technische Parameter Hubraum lauern Leistung und ähnliche Dinge und dahinter stehen immer Feature wird also Zahlenwerte also kann ich diesen Zahlenwert 2000 schon mal mit in Verbindung bringen weiß aber nicht genau was er beschreibt also muss sich dabei nicht auch noch mal nachfragen Nachfrage zu 2000 ist damit das auf der
oder ein technischer Parameter gemeint ich sag jetzt mal das warum ja dann weiß ich schon ziemlich viel es handelt sich nämlich in einer Anfrage um dieses
Auto und um das Baujahr 2 Tausend und jetzt kommt auch auf das sich Informationen sehen jetzt können die Suchmaschine nachfragen ob man das zu Verkaufsangebot möchtest du eine Dokumentation oder möchtest irgendwelche sonstigen Artikel die was mit dem Golf aus dem Jahr 2000 zu tun haben dass können 2. Verfahren dieses Spiel kündigt soweit spielen bis dann tatsächlich das gesuchte Dokument in meinen Suchergebnissen auftaucht das General Problem das wir dabei haben ist die korrekte Interpretation einer
Suchanfrage ich muss also irgendwie am den einzelnen Termin der Suche Phrase Entität zuordnen können und dazu müsste ich Sie eigentlich automatisch das wir kann das automatisch unterscheiden können was hat das jetzt von Bedeutung was steht das von Bedeutung da das kann ich so machen dass sich ständig Nachfrage aber ständig nachfragen was ist natürlich nicht gerade ein Ausbund Usability das machte Benutzer beschränkte Zeit mit weil sich eigentlich müsste die Suchmaschine doch wissen was ich meine das heißt Personalisierung ist die große Frage und die Suchmaschine muss natürlich mit dem Benutzer mit das geht natürlich auch viel besser ich könnte Wolf von 2000 eingeben und dann könnte die Suchmaschine natürlich schon oder
Suchagent auf meinen eigenen Rechner sehr viele Informationen über mich im Voraus gesammelt haben nämlich könnte festgestellt haben dass sich in den vergangenen Monaten regelmäßig Ergebnisse von Profigolfer abgerufen habe das sich im vergangenen Jahr einen Garnitur Golfschläger gekauft haben natürlich wieder Onlineshop das sich mehrere erst jetzt zum Thema Gustav Fachpublikationen abonniert haben dass ich einen Bildschirmhintergrund benutzte Beach dass es solche mehr ganz bekannter Golfplatz und das die Rechte an einer Domain Grundbesitz und dann liegt die Vermutung natürlich nach eine Suchmaschine oder man Suchagent so intelligent ist die Sache mit Bezug miteinander zu setzen das ich mich eventuell jetzt für Golf Ergebnis der Sportart aus dem Jahr 2000 irgendwie interessiert da kann ich zumindest schon mal den Vorschlag die richtige Richtung also Personalisierung ist ein quasi das ist gut ihren automatisch unterstützen kann soll damit gezeigt der Suchmaschinen werden aber noch weiter beeinflusst durch Semantik der Technologie nicht durch das so genannte wird für Anfang des Jahres kam mir
diese so Suchmaschine Wolfram Alpha mit großem Getöse quasi auf den Markt vielleicht haben Sie davon ja auch gehört und diese Suchmaschine kann ich richtige Fragen stellen da geht also wirklich fest schon an sollen also Fragen beantworten und dieses Werkzeug für das da dahintersteht könnte auch für uns wirklich wichtig werden beispielsweise wenn ich mein Navigationssystem im Auto fragen wo kann ich es am günstigsten per tanken und ich kriege dann natürlich die Antwort von den jetzt gerade aktuell das günstigste wenn sie das genau zu meinem Auto passt hier beispielsweise super verbleiben oder was auch immer das was das kostet das könnte ich mir dann natürlich online besorgen oder es ist das könnte das Navigationssystem natürlich auch die Route noch festlegen und das könnte auch noch sagen das aber nicht schneller als 80 fahren weil sonst schafft es nicht mehr dort also das heißt das Auto könnte davon auch gleich noch entsprechende mit beeinflusst werden Möglichkeit ist für den steht weiter auszubauen weitere Möglichkeit bei Suchmaschinen ist das so genannte explorative zu explorative suchen heißt
soviel wie ich möchte 1. erforschen was gibt es denn überhaupt für Ergebnisse im Bereich dessen was ich eigentlich suchen dass es also genau das was sie machen wenn sie die Bibliothek vielleicht wissen sie genau ein Autor zu dem sie ein Buch von Jones Katalog nach dass es nicht explorative das Schlagwort Besuche oder die strukturierte Suche und dann kriegen Sie die Position welchen egal das irgendwie steht das Buch das sie suchen zudem Regale und natürlich sie auch mal links und rechts oben und unten von dem was steht da sonst noch im Umfeld vielleicht steht das was mich noch interessieren könnte das heißt erforschen den Suchraum und zwar den Suchraum der so strukturiert ist nach bestimmten Aufstellung Systematik das Naheliegende Sachen zusammengehörende Sachen die zusammenkommt Suchmaschine würde das bedeuten ich suche Texte die ich den Texten von einer sind das ich weiß dass es ein Auto ist und dass ich weiß welche Autoren und beeinflusst haben das beispielsweise Informationen nicht über die Wikipedia oder die Wikipedia rauskriegen kann sich heraus dass eines beeinflusst worden ist und das Wort auch und dann ist selbst als Autor mit einem anderen Autoren nicht ständig seinen schon beeinflusst hat und da kann ich dann gucken kündigten zu diesen anderen Autoren die mit einem ursprünglichen irgendwie in Verbindung stehen Suchergebnisse und das könnte der den Benutzer interessieren und das hat keiner der Plan einer solchen Achse zum Beispiel navigiert also was bei der Exploration Suche basiert versucht die Suchmaschine externes Wissen zu nutzen um Vorschläge zu erzeugen das der um mögliche Suchanfrage aufzuzeichnen während ich also vormals genau vormals aktuell der
quasi eine Architektur haben wir sie hier ich habe ein Anwender der einen Suchdienst benutzt diese Suchdienst greift auf Dokumente zu um dann mit Hilfe eines Präsentations Dienstes also im Browser die Ergebnisse zu zeigen wir dass in Zukunft so meint wird so aus dass der Anwender einen persönlichen Assistenten hat dieser persönlicher Assistent der beginnt dann oder wird auf intelligente Infrastruktur Dienste zu greifen um den jetzt Ergebnisse zu einer Suchanfrage oder nicht den zusammenzusuchen aber wird dabei nicht nur auf eine Informationsquelle nämlich eine Suchmaschine zurückgreifen sondern auch vielfältig verzweigte Information das heißt also was man versucht man versucht hätte von Daten die mit dem Zug zu
setzen der Beispiele sind zeigt dass es heute noch sehr sehr schwer ist darum ginge Daten miteinander zu kombinieren ist die Reisebuchung und sieht wenn sie versuchen eine Reise zu planen und jetzt nicht zu einem der großen Allround Anbieter die müssen sie quasi erst nach aussuchen wo möchte ich den Mann habe ich den Platz in meinem Kalender einer der Rest der Familie die Zeit in Urlaub zu fahren muss ich Flüge buchen sich Hotelbuchung muss ich eventuell einen Wagen war sich zum anderen Dienst und der dort quasi anzugucken Urlaubsgebiet sitzt dort aus wo die das ganze den geographisch 40 muss hier sehr viele Dienste Netz angreifen und verbringe sehr sehr viel Zeit um diese Zeit könnte ich sparen wenn ich jetzt Daten mit dem Bezug setzen könnte mit einer Suchanfrage schon alle Dienste die Angreifer könne man unterscheidet dabei fortgehen eigentlich 3 verschiedene Generationen von der
Dokumente werden früher alles statisch war das heißt das fertige Seiteninhalte stellt die man abrufen können aber heute schon das dynamische Seiten die mit Hilfe von Content-Management-System erzeugt werden oder interaktive Seiten die mit Hilfe von Java Script schätzt oder sonstwas arbeiten und die ihre Inhalte interaktiv verändern aber in der 3. Generation Semantik werden virtuelle Webseiten und sogenannte adaptive Webseiten haben die werden und das Kleid quasi von unseren persönlichen Informationen Agenten nach unseren eigenen Bedürfnissen erstellt und sich dann mit quasi mit mit der Zeit der der Nutzung werden quasi unsere persönliche Informationen quasi lernt wie sich unser Nutzerprofil letztendlich für also das geht von statischen interaktiv dynamische hinzu virtuelle adaptiv derzeit das Ganze wie das praktisch umgesetzt werden soll hatten wir schon gesehen auf den einzelnen unterschiedlichen nochmal kurz verdeutlicht man muss natürlich dafür sämtliche
Resourcen identifizieren beruhigt ist man muss Vokabular definieren können Datenaustauschformat haben damit man Daten zwischen 1 und Anwendungen austauschen kann mit XML X ist aber man muss Beziehungen zwischen Information ausdrücken mit Erde von werde das Klima man muss komplexere Zusammenhänge ausdrucken können das macht man damit und so
gegenüber Hauen und wir und dann muss man versuchen aus diesem Wissen neue Informationen zu schlussfolgern dazu braucht man Ferenc Mechanismen und dann muss man noch die Vertrauenswürdigkeit bezüglich der Daten prüfen und das kann man mit XML kritischen und XML sich letztendlich und damit möcht ich dann auch schließt
nochmal zusammenfassend dass man die Welt hat den Zweck soll es autonom agierenden Anwendungsprogrammen möglich ist auf der einen Seite hätte um Daten miteinander zu vereinigen darauf zuzugreifen das einmal das wird oft miteinander das auf so dass es sich mit der Daten und Services miteinander zu setzen ich möchte durch dieses in Bezug setzen miteinander Synergien entwickeln Effekte die ich einst nicht hätte wenn ich auf die Daten zugreifen ich möchte neue Informationen mit Hilfe von Ferenc Mechanismen daraus gewinnt Semantik und gewesen das sind keine Gegensätze sondern das eigene ergänzt letztendlich wechselseitig das andere und damit das sollte man auch schon geschafft
Umsetzung <Informatik>
Objektklasse
Computerlinguistik
Momentenproblem
Kommunikation
Browser
Programm
t-Test
HTTP
Benutzerfreundlichkeit
Hypertext
Rechnernetz
Information
Computeranimation
Richtung
XML
Monster-Gruppe
Metadaten
Suchmaschine
Information Retrieval
Schriftzeichenerkennung
Softwareplattform
Theoretische Informatik
Schreiben <Datenverarbeitung>
Addition
Content <Internet>
Kontextbezogenes System
API
Web log
Sinusfunktion
Software
Dienst <Informatik>
Rechenbuch
Navigieren
Zellularer Automat
Anwendungssoftware
Server
Internetdienst
Software Engineering
Theoretische Informatik
Zeichenkette
Cursor
Mathematische Größe
Computerarchitektur
Zusammenhang <Mathematik>
Objektorientierte Programmierung
Google
Höhere Programmiersprache
Statistik
Dublin Core
Zahlenwert
Strukturierte Daten
Formalismus <Mathematik>
Normale
Bildschirmmaske
Fussball <Computerspiel>
WEB
HTML
Abfragesprache
Datenstruktur
Informatik
Inkonsistenz
Information Extraction
Summe
Programm
Soundverarbeitung
Erweiterung
Position
Vererbungshierarchie
Unicode
Aussage <Mathematik>
Großrechner
Content Management
Binder <Informatik>
Austauschformat
Apple Keynote
Kombinatorische Geometrie
Wort <Informatik>
Assistent <Programm>
Inferenz <Künstliche Intelligenz>
Instanz <Informatik>
Punkt
ERNA <Programm>
Inferenz <Künstliche Intelligenz>
Systemtheorie
Agent <Informatik>
Beschreibungssprache
Skalierbarkeit
Formale Sprache
Selbstrepräsentation
Datenbank
Prädikatenlogik
Computer
Mensch-Maschine-Schnittstelle
Computer
Steuerwerk
Systemtheorie
Krankenhausinformationssystem
Index
Web Services
Informatik
World Wide Web
Kryptologie
Natürliche Sprache
Maschinelle Übersetzung
Schlussfolgern
Router
Google
Web Services
SIMA-Dialogverfahren
Parametersystem
Statistik
Internet
Dynamik
Netzwerk <Graphentheorie>
Benutzerfreundlichkeit
Datenhaltung
Kryptologie
Reihe
Abfrage
Web Site
p-Block
Elektronische Unterschrift
Zahl
Index
Künstliche Intelligenz
Geschlecht <Mathematik>
Ganze Zahl
Bildschirmschoner
Multi-Tier-Architektur
Anwendungsprogramm
Dateiformat
Desktop
Information
Semantic Web
World Wide Web
Standardabweichung
Datenbank
Zugbeanspruchung
Wissensrepräsentation
Metadaten
Semantische Konsistenz
RDF <Informatik>
Kombinatorische Gruppentheorie
Web-Seite
Division
Netzadresse
Ausdruck <Logik>
Wurm <Informatik>
Datensatz
Ungelöstes Problem
Formalismus <Mathematik>
XML
Information Extraction
Grundraum
Struktur <Mathematik>
Cross-site scripting
Internet
Programmiersprache
Autorisierung
DatenbankManager
Benutzeroberfläche
Kurve
Künstliche Intelligenz
Softwareplattform
Umsetzung <Informatik>
HANS <Datenbanksystem>
Keller <Informatik>
Mensch-Maschine-Schnittstelle
Objekt <Kategorie>
Schlussfolgern
Parametersystem
Computerarchitektur
Suchmaschine
Systems <München>

Metadaten

Formale Metadaten

Titel Einführung (Teil 2) / Vom WWW zum Semantic Web
Serientitel Semantic Web WS 2009/10
Teil 2
Anzahl der Teile 14
Autor Sack, Harald
Lizenz CC-Namensnennung - keine kommerzielle Nutzung 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen und nicht-kommerziellen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
DOI 10.5446/11265
Herausgeber Hasso Plattner Institut (HPI)
Erscheinungsjahr 2009
Sprache Deutsch
Produzent Hasso Plattner Institut (HPI)

Inhaltliche Metadaten

Fachgebiet Informatik
Schlagwörter Suchmaschine
Information Retrieval
Problemfelder
Information
Semantik
Data
Document
Kommunikation
Rechner
Internet
Web
WWW
Semantic Web

Ähnliche Filme

Loading...
Feedback