RDF-Export von Metadaten des TIB AV-Portals
Die Technische Informationsbibliothek hat sich zum Ziel gesetzt, Nutzung und Verbreitung ihrer Sammlungen zu fördern. Vor diesem Hintergrund veröffentlicht die Technische Informationsbibliothek die autoritativen sowie zeitbasierten, automatisch generierten Metadaten von Filmen des TIB AV-Portals als Linked Open Data. Bereitgestellt werden nur Metadaten und Vorschaubilder von Filmen im Bestand der TIB, für die eine Nutzung der Metadaten und Vorschaubilder unter der Lizenz CC0 1.0 Universal vereinbart worden/möglich ist. Bitte beachten Sie, dass die Daten teilweise automatisch generiert wurden und daher Fehler enthalten oder unvollständig sein können.
Darüber hinaus bietet die TIB die Metadaten des TIB AV-Portals auch über eine OAI-Schnittstelle an - in den Formaten OAI Dublin Core, MARC XML oder RDF XML.
Inhaltsverzeichnis
Datensätze
Gesamtbestand
Dateiname | Format | Größe | Erzeugt am: | Version: |
---|---|---|---|---|
tib-av-portal-export-2023-09-26.ttl (zipped) | text/turtle | ~1.4GiB (unzipped ~13.9GiB) | 27.09.2023 | 2023-09-26 |
Filme des Herausgebers IWF Wissen und Medien gGmbH i.L.
Diese Dumps sind eine Teilmenge des Gesamtbestands. Sie enthalten nur die Videos des Herausgebers IWF Wissen und Medien gGmbH i.L..
Dateiname | Format | Größe | Erzeugt am: | Version: |
---|---|---|---|---|
tib-av-portal-export-iwf-2023-09-26.ttl (zipped) | text/turtle | ~25.0MiB (unzipped ~210.6MiB) | 27.09.2023 | 2023-09-26 |
Zusätzliche Daten und Mappings
Mapping der Fächer des TIB AV-Portals auf DBpedia und GND
Dateiname | Format | Größe | Erzeugt am: | Version: |
---|---|---|---|---|
tib-av-portal-subjects-1.0.0.ttl | application/turtle | 11kB | 18.03.2016 | 1.0.0 |
Mapping der TIB AV-Portal VCD Klassen auf DBpedia, Wikidata und GND
Filename | Format | Size | Date created: | Version: |
---|---|---|---|---|
tib-av-portal-classes_vcd-1.0.1.ttl | application/turtle | 48kB | 26.06.2018 | 1.0.1 |
tib-av-portal-classes_vcd-1.0.1.n3 | application/turtle | 11kB | 26.06.2018 | 1.0.1 |
Lizenz
Für die Nutzung der Metadaten und der bereitgestellten Vorschaubilder gelten die Bedingungen der Creative Commons Lizenz CC0 1.0 Universal (CC0 1.0) Public Domain Dedication.
(Hier klicken, um zur Zusammenfassung und zum rechtsverbindlichen Lizenztext zu gelangen.)
Anerkennung
Bitte verweisen Sie bei Nutzung der Daten auf die TIB und verlinken auf die Seite https://av.tib.eu/opendata, um die Verbreitung und Nutzung der Daten zu fördern.
Dokumentation der Datensätze
Diese Dokumentation bietet einen kurzen Überlick über die Strukturen der Datensätze des TIB AV-Portals. Es wird erläutert, wie die Datensätze in einer RDF-Datenbank importiert und mit SPARQL abgefragt werden können.
Strukturen der Daten
In diesem Abschnitt wird in die Struktur der RDF-Daten des TIB AV-Portals anhand von Beispielen und Abbildungen erläutert.
Die folgende Tabelle zeigt die verwendeten RDF-Namensräume.
Präfix | Namensraum | Vokabular |
---|---|---|
bibframe | http://bibframe.org/vocab/ | Bibframe-Vokabular |
dbp | http://dbpedia.org/resource/ | DBpedia-Ressourcen |
dcterms | http://purl.org/dc/terms/ | DCMI-Metadata-Terme |
dctypes | http://purl.org/dc/dcmitype/ | DCMI-Typen-Vokabular |
foaf | http://xmlns.com/foaf/0.1/ | Friend-of-a-Friend-Vokabular |
gnd | http://d-nb.info/gnd/ | Integrated Authority File (GND) |
schema | http://schema.org/ | Schema.org-Vokabular |
tib | http://av.tib.eu/resource/ | Ressourcen des TIB AV-Portals |
cnt | http://www.w3.org/2011/content# | Repräsentiert Inhalte in RDF |
itsrdf | http://www.w3.org/2005/11/its/rdf# | Internationalization Tag Set (ITS) |
nif | http://persistence.uni-leipzig.org/nlp2rdf/ontologies/nif-core# | NLP Interchange Format |
oa | http://www.w3.org/ns/oa# | Open Annotation Data Model |
rdf | http://www.w3.org/1999/02/22-rdf-syntax-ns# | Resource Description Framework |
Hinweis: Die Verwendung von Schrägstrichen '/' im Präfix-Namen führt bei der Darstellung in Turtle-Syntax zu Problemen. Sie müssen deshalb durch ein vorangestelltes '\' markiert werden (Escape-Sequence).
Beispiel 1: Video-Standard-Metadaten (Datatype Properties / Literale):
tib:video\/16453 schema:name "Wall-crossing and geometry at infinity of Betti moduli spaces"@en ;
schema:description "Linear algebraic differential equation (in one variable) depending on a small ..."@en ;
schema:keywords "Betti moduli"@en , "chaos theory"@en, "singularity"@en ;
schema:date Created "1973-01-01T00:00:00+01:00"^^<http://www.w3.org/2001/XMLSchema#gYear> .
schema:duration 1:16:48 .
Beispiel 2: Video-Standard-Metadaten (Object Properties)
tib:video\/16453 rdf:type schema:Movie ;
schema:url <https://av.tib.eu/media/16453> ;
schema:producer gnd:4028361-6 ;
schema:publisher tib:Institut_des_Hautes__tudes_Scientifiques_%28IH_S%29 ;
schema:license <http://creativecommons.org/licenses/by/3.0/deed.en> ;
schema:availability schema:OnlineOnly ;
bibframe:doi <http://dx.doi.org/10.5446/16453> ;
schema:thumbnailUrl <https://av.tib.eu/images/avpimg1fdaede78b338bba137140fd805cd382> .
tib:Institut_des_Hautes__tudes_Scientifiques_%28IH_S%29 foaf:name “Institut des Hautes Études Scientifiques (IHÉS)” .
Hinweis: Soweit möglich wurden 'publisher', 'producers', 'creators' etc. auf bereits existierende Wissensbasen und Normdateien (z.B. GND) abgebildet. In einigen Fällen konnte keine entsprechende Zuordnung vorgenommen werden. In diesen Fällen wurden die Ressourcen durch einen IRI mit dem Präfix 'tib:' und den dazugehörigen Informationen (z.B. foaf:name) repräsentiert. In weiteren Versionen der Datensätze des TIB AV-Portals werden diese IRIs, wenn möglich, durch die Referenz der entsprechenden Wissensbasis bzw. Normdatei ersetzt.
Beispiel 3: OCR-Ergebnisse
tib:video\/16453?t=smpte-25:0:28:17:11&xywh=368,316,292,15 dcterms:isPartOf tib:video\/16453 .
tib:ocr\/16453_42436_42436_x368y316h15w292 oa:hasTarget tib:video\/16453?t=smpte-25:0:28:17:11&xywh=368,316,292,15 ;
oa:hasBody tib:ocr\/16453_42436_42436_x368y316h15w292?char=0,7 ;
oa:annotatedBy tib:annotator\/OCR-1.0.0 ;
rdf:type oa:Annotation .
tib:ocr\/16453_42436_42436_x368y316h15w292?char=0,7 rdf:type nif:Context ;
rdf:type nif:RFC5147String ;
nif:isString “optimal” .
Beispiel 4: VCD-Ergebnisse
tib:video\/16453?t=smpte-25:0:01:02:07 dcterms:isPartOf tib:video\/16453 .
tib:vcd\/16453_1347007_1557 oa:hasTarget tib:video\/16453?t=smpte-25:0:01:02:07 ;
oa:hasBody tib:visualconcepts/Lecture ;
oa:annotatedBy tib:annotator\/VCD-1.0.0 ;
oa:motivatedBy oa:tagging ;
rdf:type oa:Annotation .
tib:visualconcepts\/Lecture rdf:type oa:SemanticTag .
Beispiel 5: Named Entity Linking der OCR/ASR
tib:video\/16453?t=smpte-25:0:05:00:22,0:05:03:00 dcterms:isPartOf tib:video\/16453 .
tib:asr\/16453_13753838_7522 oa:hasTarget tib:video\/16453?t=smpte-25:0:05:00:22,0:05:03:00 ;
oa:annotatedBy tib:annotator\/ASR-1.0.0 ;
rdf:type oa:Annotation ;
oa:hasBody tib:asr\/16453_13753838_7522#char=0,5617 .
tib:asr\/16453_13753838_7522?char=0,5617 rdf:type nif:Context ;
rdf:type nif:RFC5147String .
tib:asr\/16453_13753838_7522?char=4743,4747 nif:referenceContext tib:asr\/16453_13753838_7522?char=0,5617 ;
itsrdf:taIdentRef gnd:4038613-2 ;
itsrdf:taAnnotatorsRef tib:annotator\/NEL-1.0.0 ;
rdf:type nif:Phrase ;
rdf:type nif:String ;
nif:beginIndex "4743" ;
nif:beginIndex "4747" ;
nif:anchorOf "sets" .
Import der Datensätze in RDF-Datenbank (Triple-Store)
Folgende Tabelle zeigt einige RDF-Datenbanken, die für den Import genutzt werden können.
Virtuoso Opensource | https://vos.openlinksw.com/owiki/wiki/VOS/ |
Sesame | http://rdf4j.org/ |
Apache Jena TBD | https://jena.apache.org/documentation/tdb/ |
Blazegraph | https://www.blazegraph.com/ |
Im Folgenden wird Blazegraph als Beispiel verwendet, um die RDF Daten zu laden und abzufragen.
Zur Installation von Blazegraph laden Sie die Blazegraph jar-Datei herunter. Zum starten von Blazegraph befolgen Sie die Anleitung unter: https://github.com/blazegraph/database/wiki/Main_Page
Sobald Blazegraph gestartet wurde kann die Nutzerschnittstelle im Webbrowser geöffnet werden:
http://localhost:9999/blazegraph/
Laden Sie den Datensatz des TIB AV-Portals aus der obigen Tabelle herunter und entpacken Sie ihn.
Um den Datensatz des TIB AV-Portals in Blazegraph zu importieren, benutzen Sie das Kommando aus dem Blazegraph Screenshot:
- gehen Sie zum Tab „UPDATE“ in Blazegraph
- geben Sie die vollständige absolute URL Ihres lokalen entpackten Datensatzes im Eingabefeld ein
- wählen Sie den Typen: „File Path or URL“ aus dem Auswahlmenü aus
- drücken Sie den „Update“-Knopf darunter
Das Update sollte nun beginnen („Running updates ...“). Das Update wird wahrscheinlich einige Minuten dauern (ca. 10 bis 30 Minuten, je nach Leistungsfähigkeit Ihres Computers). Wenn das Update erfolgreich ausgeführt wurde, wird dies durch eine Meldung wie „Modified: 10099269 Milliseconds: 1441798“ angezeigt.
Abfragen der Daten mit SPARQL
Wechseln Sie in Blazegraph in den Tab „QUERY“ und geben Sie die unten stehenden Beispielabfragen ein.
Folgende Präfixe müssen in jeder Abfrage verwendet werden:
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX gnd: <http://d-nb.info/gnd/>
PREFIX schema: <http://schema.org/>
PREFIX tib: <http://av.tib.eu/resource/>
PREFIX itsrdf: <http://www.w3.org/2005/11/its/rdf#>
PREFIX nif: <http://persistence.uni-leipzig.org/nlp2rdf/ontologies/nif-core#>
PREFIX oa: <http://www.w3.org/ns/oa#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
Beispiel 1: Zeige das Video mit der ID 16453 zusammen mit all seinen Tripeln.
SELECT *
WHERE {
tib:video\/15293 ?p ?o .
}
Beispiel 2: Zeige alle Videos des Herausgebers 'IWF (Göttingen)'.
SELECT DISTINCT ?movie
WHERE {
?movie rdf:type schema:Movie .
?movie schema:publisher <http://av.tib.eu/resource/IWF_%28G%C3%B6ttingen%29> .
}
Beispiel 3: Zeige alle Videos mit dem Term ‘big data’ in ihrem Titel
SELECT DISTINCT ?movie ?name
WHERE {
?movie rdf:type schema:Movie .
?movie schema:name ?name .
FILTER REGEX(STR(?name), 'big data', 'i') .
}
Beispiel 4: Wie viele Videos wurden mit einem visuellen Konzept annotiert?
SELECT (COUNT(DISTINCT ?video) AS ?count)
WHERE {
?annotation oa:annotatedBy tib:annotator\/VCD-1.0.0 .
?annotation oa:hasTarget ?videoFragment .
?annotation oa:hasBody ?concept .
?videoFragment dcterms:isPartOf ?video .
}
Beispiel 5: Zeige alle Videos, die mit der GND-Entität ‘http://d-nb.info/gnd/4298379-4’ annotiert wurden.
SELECT ?video
WHERE {
?phrase itsrdf:taIdentRef gnd:4298379-4 .
?phrase nif:referenceContext ?context .
?annotation oa:hasBody ?context .
?annotation oa:hasTarget ?videofragment .
?videofragment dcterms:isPartOf ?video .
}
Beispiel 6: Für wie viele Videos gibt es OCR-Analyse-Ergebnisse?
SELECT (COUNT(DISTINCT ?video) AS ?count)
WHERE {
?annotation oa:annotatedBy tib:annotator\/OCR-1.0.0 .
?annotation oa:hasTarget ?videofragment .
?videofragment dcterms:isPartOf ?video .
}