Das TIB AV-Portal
Das TIB AV-Portal ist eine Open-Access-Plattform für wissenschaftliche Videos mit dem Schwerpunkt auf Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik. Mit der Zeit hat sich das Spektrum des Portals erweitert und umfasst nun eine breitere Palette wissenschaftlicher Disziplinen, einschließlich Geistes- und Sozialwissenschaften, Wirtschafts- und Rechtswissenschaften sowie Medizin (siehe Fächerseite). Nutzerinnen und Nutzer des Portals haben Zugang zu einer Vielfalt an Videoinhalten, darunter Vorlesungs- und Konferenzaufzeichnungen, Simulationen, Animationen, Experimente, Interviews und Videoabstracts sowie Open Educational Resources.
Entwickelt wurde das Portal von Juli 2011 bis April 2014 durch das Lab Nicht-Textuelle Materialien der Technischen Informationsbibliothek (TIB) in Kooperation mit dem Hasso-Plattner-Institut für Softwaresystemtechnik. Im April 2014 erfolgte der Onlinegang des Portals, das bis 2019 durch die yovisto GmbH betrieben und im Auftrag der TIB weiterentwickelt wurde. Im September 2018 wurde an der TIB das "Scrum Team AV-Portal“ gegründet, das mit der Aufgabe betraut wurde, sämtliche Softwareprojekte des Portals in die Infrastruktur der TIB zu migrieren. Seit 2020 liegt die Verantwortung für den Betrieb und die kontinuierliche Weiterentwicklung des Portals in den Händen des Scrum Teams der TIB.
Das TIB AV-Portal vereinfacht die Suche, Zitierung und Publikation wissenschaftlicher Videos und bietet darüber hinaus die Möglichkeit, Videos herunterzuladen, zu lizenzieren oder als DVD zu bestellen. Dank der Verwendung von Creative-Commons-Lizenzen ist ein Großteil der Inhalte frei nachnutzbar.
Zu den Services des TIB AV-Portals zählen:
- Hosting und Langzeitarchivierung von Videos und Begleitmaterialien
- DOI-Registrierung für die dauerhafte Zitierbarkeit
- Rechteklärung und Lizenzberatung
- Sprach-, Text- und Bilderkennung
- Kontinuierliche Weiterentwicklung des Portals
- Redaktionelle Begleitung
- Offen, werbefrei und DSGVO-konform
Lernen Sie das TIB AV-Portal in nur 120 Sekunden kennen!
Szenenerkennung – Shot Boundary Detection segmentiert das Video anhand von Schnitten. Ein daraus erzeugtes visuelles Inhaltsverzeichnis gibt einen schnellen Überblick über den gesamten Videoinhalt und erleichtert den gezielten Zugriff auf spezifische Abschnitte. Jede Szene kann via Media Fragment Identifier sekundengenau zitiert werden. Als Technik wird PySceneDetect verwendet.
Texterkennung – Video Optical Character Recognition erfasst, indexiert und macht geschriebene Sprache, wie beispielsweise Text auf Präsentationsfolien, durchsuchbar. Hierzu wird Tesseract eingesetzt.
Spracherkennung – Automatic Speech Recognition transkribiert die gesprochene Sprache im Video. Das Ergebnis ist ein Transkript mit Zeitstempeln, das eine zielgenaue Suche ermöglicht. Die KI-basierte Spracherkennung „Whisper“ transkribiert 100 Sprachen, darunter Englisch, Deutsch, Französisch, Spanisch und Ukrainisch, und übersetzt diese Sprachen ins Englische. Entsprechend werden die Videountertitel und Transkripte sowohl in der Originalsprache als auch in englischer Übersetzung angeboten.
Bilderkennung – Visual Concept Detection indexiert das Bewegtbild mit visuellen Konzepten wie zum Beispiel "Computeranimation" oder "Experiment". Momentan arbeitet das Scrum Team AV-Portal zusammen mit der Forschungsgruppe Visual Analytics an der Weiterentwicklung der Bilderkennung. In Zukunft wird voraussichtlich ein Open-Clip-Modell das Labeling der visuellen Konzepte ausführen.
Verschlagwortung – Named Entity Linking verknüpft die einzelnen Videosegmente mit Sachbegriffe aus der Gemeinsamen Normdatei. Die Begriffe sind disambiguiert und haben Verwandtschaftsbeziehungen zu anderen Begriffen, was eine effektivere Suche ermöglicht.
Prinzipiell werden Videos nur dann automatisch analysiert, wenn dies rechtlich zulässig ist. Dabei wird die Sprache des Videos in ein maschinenlesbares Transkript umgewandelt, das als Untertitel angezeigt und durchsucht werden kann. Nicht-englischsprachige Videos werden ins Englische übersetzt; diese Übersetzungen stehen sowohl als Untertitel als auch als durchsuchbare Transkripte zur Verfügung.
Annotationen von Sprache, Text und Bild werden ausschließlich für Videos erstellt, die den sechs Kernfächern der Technischen Informationsbibliothek (TIB) zuzuordnen sind: Technik, Architektur, Chemie, Informatik, Mathematik und Physik. Der Hintergrund dafür ist, dass derzeit nur für diese Fächer ein Vokabular für die automatische Annotation vorliegt.
Das TIB AV-Portal bietet sowohl eine deutsche als auch eine englische Benutzeroberfläche, die über die Sprachauswahl in den Benutzereinstellungen (oben rechts) ausgewählt werden kann. Viele Metadaten sind auf Deutsch und Englisch verfügbar, sodass im Suchfeld deutsche wie auch englische Suchbegriffe eingegeben werden können. Wenn ein deutscher Suchbegriff eingegeben wird, werden automatisch auch die englischen Übersetzungen mit durchsucht; dasselbe gilt umgekehrt für englische Suchbegriffe.
Die automatische Spracherkennung Whisper, die wir zur Erstellung der Untertitel und durchsuchbaren Transkripte verwenden, kann etwa 100 Sprachen transkribieren. Dazu gehören Deutsch, Englisch, Spanisch, Französisch, Italienisch, Griechisch, Russisch, Ukrainisch, Polnisch, Japanisch, Türkisch und Chinesisch.