Mensch-Maschine-Interaktion bei digSubmission Application für den automatischen pre-Ingest und Ingest

Zitieren

Technische Informationsbibliothek (TIB)

Niedersächsisches Landesarchiv

Markus, Katharina

Formale Metadaten

Titel

Mensch-Maschine-Interaktion bei digSubmission Application für den automatischen pre-Ingest und Ingest

Serientitel

25. Tagung des Arbeitskreises „Archivierung von Unterlagen aus digitalen Systemen“ (AUdS)

Anzahl der Teile

Autor

Markus, Katharina

0000-0002-9316-8982 (ORCID)

Lizenz

CC-Namensnennung 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.

Identifikatoren

10.5446/57157 (DOI)

Herausgeber

Technische Informationsbibliothek (TIB)

Niedersächsisches Landesarchiv

Erscheinungsjahr

2022

Sprache

Deutsch

Produktionsjahr

2022

Inhaltliche Metadaten

Fachgebiet

Information und Dokumentation

Genre

Konferenz/Talk

Abstract

Die Submission Application für die Langzeitarchivierung bei ZB MED wurde anhand eines Use Cases entworfen. Dieser Use Case betrifft zu archivierende Konferenz-Abstracts auf einem Publikationsportal, dem Portal German Medical Science. Dabei war die Datenstruktur des Publikationsportals mit den Ansprüchen an eine umfangreiche und zukunftsfähige Langzeitarchivierung zu vereinen. Darüber hinaus wurde bei der Konzipierung der Submission Application die Weiterverwendung für andere Workflows mitgedacht. Die Submission Application und die von ihr erstellten Submission Information Packages (SIPs) sollen in diesem Vortrag vorgestellt werden. Das Archivierungssystem von ZB MED nutzt die Software Rosetta und wird in Kooperation mit Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek (TIB) und Leibniz-Informationszentrum Wirtschaft (ZBW) betrieben, wobei TIB die Administration und das Hosting des Systems übernimmt. Da Rosetta primär Vorgaben für den Ingest macht, konnte vor allem der davor liegende pre-Ingest vergleichsweise frei gestaltet werden. Die an ZB MED konzipierte Submission Application besteht aus zwei Teilen. Der Workflow-spezifische Teil interagiert mit dem Publikationsportal, holt Daten ab und generiert SIPs entsprechend der Datenstruktur der Sammlung. Der zweite, generische Teil übergibt die erstellte SIP an das Langzeitarchivierungssystem über den von Rosetta bereitgestellten METS-Ingest. Sowohl SIP-Struktur als auch Metadaten-Übernahme wurden granular konzipiert. Dabei wird sowohl für jede Abstract-Publikation wie auch für die Beschreibung der Konferenz eine SIP generiert. Metadaten aus unterschiedlichen Quellen werden kombiniert um beide Level, die übergeordnete Konferenz sowie die einzelnen Abstracts, abzubilden. In den Workflow-spezifischen Teil ist außerdem eine Validierungsroutine und eine PDF/A-Generierungsroutine integriert. Die Validierung dient dazu, den Datenproduzenten in der gleichen Institution invalide Dateien frühzeitig im Workflow zu melden und diese von ihnen korrigieren zu lassen. PDF/A-Dateien werden für diese Sammlung generiert, wenn Textpublikationen nicht in PDF für die Langzeitarchivierung bereitstehen.

Schlagwörter

Deutsch	Deutsch Digitale Langzeitarchivierung
Englisch	Englisch digital long-term preservation