We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Über Spartengrenzen hinaus: Anforderungen an den digitalen Lesesaal des Archivs der sozialen Demokratie

00:00

Formal Metadata

Title
Über Spartengrenzen hinaus: Anforderungen an den digitalen Lesesaal des Archivs der sozialen Demokratie
Title of Series
Number of Parts
21
Author
License
CC Attribution 3.0 Germany:
You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor.
Identifiers
Publisher
Release Date
Language
Production Year2022

Content Metadata

Subject Area
Genre
Abstract
Das Archiv der sozialen Demokratie hat sich im Rahmen eines Reorganisationsprozesses gemeinsam mit der Bibliothek der Friedrich-Ebert-Stiftung (FES) zu einer gemeinsamen Abtei-lung zusammengeschlossen und Anfang 2021 neue Arbeitsstrukturen etabliert, um Synergien in den Kernbereichen der jeweiligen Arbeit zu heben und integrierte Services für seine Nutzer:innen anzubieten. Die digitale Langzeitarchivierung sowohl von Archiv- als auch von Bibliotheksgut wie auch die Zurverfügungstellung sind als wesentliche Bausteine identifiziert worden, um Infrastrukturen gemeinsam zu nutzen. Die Zusammenführung von Anwendun-gen und Systemen wird zentral von einer spartenübergreifenden Arbeitseinheit geleistet und mit der Prämisse verfolgt, Konsolidierung und Streamlining von Prozessen und unterstützen-den Systemen zu erreichen. Die Berücksichtigung der spezifischen fachlichen Anforderungen von Bibliotheks- und Archivseite sowie die mit ihnen einhergehenden Einschränkungen stellen vor diesem Hintergrund besondere Herausforderungen dar. Der angebotene Beitrag skizziert praxisbezogen die Bestandsaufnahme verschiedener Angebote, die zu einem digitalen Lesesaal fortentwickelt werden. Der Ausbau des digitalen Lesesaals erfolgt projektbezogen in mehreren Stufen. Darstellung und Recherche digitalisierter historischer Zeitungen, Zeitschriften, Periodika und monographischer Veröffentlichungen sollen in einer einheitlichen Anwendung umgesetzt werden, die parallel zu einer Online-Anwendung des Archivinformationssystems betrieben wird. Mit der Implementierung einer digitalen Quellenedition plant das AdsD eine Fortführung bestehender Reihen, die zeitgemäßen Ansprüchen Rechnung trägt. Das Webarchiv als letzte Komponente steht im digitalen Le-sesaal mit einem bis zu 20 Jahre zurückreichenden Angebot an Websites sowie jüngst auch einer Auswahl gesicherter Twitter-Kanäle in den Räumlichkeiten des Archivs zur Verfügung. Diese Ausgangsstellung eröffnet eine thematisch weit gefasste Reihe von Anschlussfragen. Neben organisatorischen und technischen Facetten der spartenübergreifenden Realisierung eines digitalen Lesesaals adressiert der Beitrag auch die rechtliche Problemstellung im Kontext der Social Media-Archivierung. Ein weiterer aufgeworfener Aspekt, verortet an der Schnittstelle zwischen anwendungsorientierten Disziplinen und Gedächtniseinrichtungen, ist schließlich die Bearbeitung retrodigitalisierter Quellen und die Art ihrer Nutzbarmachung so-wie die hieraus resultierenden quellenkritischen Implikationen.
Keywords
German
German
English
English
Computer animation
Transcript: German(auto-generated)
Ja, danke schön. Danke auch für die Gelegenheit hier und das Interesse, einige Überlegungen zum Stand und zum Ausbau des digitalen Leseseils im Archiv der Sozialen Demokratie präsentieren zu können. Es wurde gerade schon gesagt, das Archiv der Sozialen Demokratie beinhaltet nach einer umfassenden Reorganisation das Archiv, aber auch die Bibliothek der Friedrich-Ebers-Stiftung.
Und meine Kollegin und ich adressieren in unserem Beitrag einerseits ein paar organisatorisch-technische Aspekte und vor allem andererseits nach der Schnittstelle zur Nutzung ein paar Fragen aufwerfen.
Ja, wie Sie auf der Folie sehen, in der wir versucht haben, mit einigen Projekten einen Zeithorizont unseres Tuns darzustellen, sprechen wir jetzt auch in diesem Kontext nicht von einer einzigen technischen Lösung, wenn doch im digitalen Leseseil sprechen, sondern begreifen den digitalen Leseseil viel mehr als eine konzeptionelle Gesamtheit der
verschiedenen Anwendungen, die einerseits zur Recherche zur Verfügung stehen, für Archiv- und Bibliotheksgut, andererseits eben natürlich auch zur Nutzung. Wir machen das exemplarisch und versuchen, ja, ich sage mal dieses große Thema eine Schneise zu schlagen,
einerseits mit dem Webarchiv und andererseits mit dem Thema digitale Quellenedition. Und wie Sie diesen Zeithorizont hier auch entnehmen können, sind wir ja gewissermaßen mitten drin im Ausbau, in der Fortentwicklung, sodass wir hier gewissermaßen einen Werkstattbericht erstatten können. Ich beginne zunächst mit der Quellenedition. Vielleicht können wir
vorlesen? Genau, danke. Das ADSD ist grundsätzlich mit der Betreuung analog bislang erschienener Quellenedition schon seit vielen Jahren vertraut. Das betrifft einerseits die
Spitzengremien der SPD, die in Form einer Reihe erscheinen, andererseits eben auch Quellen zur deutschen Gewerkschaftsbewegung. Und nach den jüngst erschienenen Bänden haben wir nun eben die Grundsatzentscheidung getroffen, eine digitale Edition ins Werk zu setzen. Wir wollen zunächst einmal den ersichtlichen Mehrwert an der Stelle
realisieren, dass wir nicht mehr an eine Buchproduktion gebunden sind. Das heißt, die Bereitstellungszyklen für die vorliegenden Arbeitsergebnisse und die wissenschaftliche Kontextualisierung können sich entsprechend dynamisieren, sodass wir hier also eine
nutzungsfreundlichere Lösung hoffentlich realisieren werden können. Wir haben bei dieser Konzeption die Grundsatzentscheidung getroffen, eine verhältnismäßig schlanke Edition vorzusehen und diese mit externen Informationsangeboten anzureichern. Das heißt,
dass wir natürlich wesentliche wissenschaftliche Editionsleistung erbringen, aber dann eben zum Beispiel durch Verknüpfung von Normdaten oder aber auch durch Angebote, die extern überhaupt erst erfolgen und die wir dann referenzieren, noch weitere
Angebote zur Verfügung stellen. Dies kann einerseits beispielsweise, ich habe Normdaten angesprochen, natürlich beispielsweise die BND sein oder weitere biografische Angebote, die ansonsten konventionellerweise in Form von Biogrammen im Rahmen der Edition
mitgegeben werden würden. Es kann sich dabei aber auch natürlich um eigene Angebote handeln, wir haben an der Reise um retro-digitalisierten Angeboten, die in diesem Kontext auch gewinnprägend referenziert werden können. Beispielsweise die gewerkschaftlichen
Monatshefte als führendes Theorieorgan des DGB sind sicherlich eine sehr gute Quelle oder aber auch bessere Mitteilungen, die retro-digitalisiert vorliegen, sodass wir auch die Grenze zwischen Archiv und Bibliothek mit diesem Angebot überwinden können bzw. zumindest die verschiedenen Angebote zusammenführen können. So viel vielleicht kurz zur
Konzeption, es ergeben sich daraus einige Fragen hinsichtlich der Nutzung aus unserer Sicht, die zum Teil die Quellenedition in einem engeren Sinne betreffen, die aber auch darüber hinaus für andere Angebote eine gewisse Gültigkeit haben. Das sind einige Punkte.
Zunächst einmal stellt grundsätzlich eine solche Form der Edition, sie trägt den Charakter der Unabbeschlossenheit oder der Offenheit, wenn man so will, weil natürlich dadurch, dass nicht nur die die Edition im engeren Sinne vorliegt, sondern immer
auch externe Angebote referenziert werden, eine Veränderlichkeit, eine Dynamik entsteht, also die referenzierten Quellen werden beispielsweise aktualisiert, sie werden aber im Extremfall sogar abgeschaltet, stehen irgendwann nicht mehr zur Verfügung oder aber, und das ist sicherlich der, das wäre dann hoffentlich der erfreulichere Fall, es kommen
neue hinzu, eine solche Edition kann natürlich auch ganz anders fortentwickelt werden und wachsen. Dies betrifft externe Angebote, aber das betrifft natürlich auch unsere eigenen beispielsweise Digitalisierungsarbeiten. Insofern ergibt sich hier aus der Nutzung und
aus dem Stand der Edition eine Form der Zeitbebundenheit, die aus Nutzungsperspektive aus unserer Sicht wichtig ist und deutlich gemacht werden muss. Der zweite Punkt betrifft die schon angesprochenen externen Informationsangebote. Es ist natürlich einerseits nicht neu, dass
weitere im Zuge der Nutzung solche Angebote, beispielsweise biografische Handbücher oder dergleichen hinsichtlich ihrer wissenschaftlichen Validität geprüft werden müssen, was insofern eine Anforderung an die NutzerInnen darstellt, gleichwohl verschwimmen natürlich die Grenzen
im Rahmen einer solchen zusammengehenden Edition. Viel stärker, es wird nicht mehr so deutlich, es wird nicht mehr so deutlich wie im analogen Bereich. Durch die Gegenüberstellung von Faximele und Transkript ermöglichen wir die Nachvollziehbarkeit der Editionsentscheidung.
Auch das ist gegenüber der Form, wie die Bände bifflang erschienen sind, da ist es eine Form des Buchsatzes, ein Gewinn, ein Zugewinn, eine Nutzungsfreundlichkeit und das stellt vor allen Dingen dann eben auch eine Form des Medienobstrein-Nachvollziehens ermöglicht ist.
Sie müssen also nicht mehr in den physischen Leser gewissermaßen kommen, um die Originalprotokolle beispielsweise einzusehen. Ein wichtiger Punkt, der sicherlich nicht auf die digitale Quellenedition beschränkt ist, hier kommt da einfach nur auch zum Tragen, das ist, ja ich
habe es genannt, Factor-Maschine, also die in diesem Kontext sicherlich einzusetzenden OCR-Softwares verfügen über unterschiedliche Erkennungsquoten, aber auch über unterschiedliche Fehlerquoten und zu einer Beurteilung des Ergebnisses, die natürlich verzerrend wirken
und zu einer Beurteilung des Ergebnisses. Es ist daher aus unserer Sicht geboten, dass wir also auch versuchen, unseren Arbeitsprozess ein Stück weit transparent zu machen, die Software eben entsprechend beispielsweise auch offen zu legen, die eingesetzt ist. Dann komme ich zum
letzten Punkt, die TI-Dateien, die also den Volltext, die editorische Bearbeitung umfassen, betrachten wir selbst auch als Forschungsdaten, geben sie dann wiederum in die Langzeiterchivierung, um einerseits, um perspektivisch weitere Nutzungsformen an der Stelle auch zu
ermöglichen, die an der Stelle gar nicht mitgedacht sind, beispielsweise im Kontext von Korpusbildung oder dergleichen und damit übergebe ich. Ich mache jetzt also noch
einen Schritt zum Webarchiv, quasi also einen anderen Respekt von diesem Angebot, von den verschiedenen Angeboten in unserem Digitalwesesaal und mit dem Schritt zum Webarchiv mache ich letztlich auch noch mal einen Schritt sozusagen zurück vor die technisch inhaltlichen Anforderungen zu einer Art Basisanforderungen, nämlich der
Rechtskonformität oder zumindest der Minimierung des Risikos von Rechtsbrüchen. Also letztlich der Frage, was dürfen wir eigentlich zeigen? Webseiten sind da schon immer ein komplexes Thema und das wird bei uns im Moment noch ein bisschen akut verkompliziert, dadurch,
dass wir letztes Jahr begonnen haben mit der Archivierung von einzelnen Kanälen aus Twitter, wobei ich an der Stelle hier auch noch mal, wenn er schon anwesend ist, Herrn Malwitz auch noch mal danken kann für die Bereitstellung seiner sehr hilfreichen Twin Scripts, die wir benutzen. Genau, das Hauptproblem bei Web- und Social Media Archivierung ist,
auch bei der Bereitstellung, ist letztlich das Vorheberrecht. Wir haben uns dazu ein Gutachten anfertigen lassen und haben auf der Basis dieses Gutachtens jetzt für uns zwei mögliche Nutzungsformen festgestellt. Das ist zum einen, dass NutzerInnen bei uns im Lesesseil vor Ort Webseiten einsehen können. Das ist also die Terminalösung. Die andere
Möglichkeit ist, dass wir Dateien zur Proposbildung eben als Kopie sozusagen NutzerInnen bereitstellen können. Dafür ist aber vorher eine Registrierung bei uns notwendig als NutzerInnen und damit die Anerkennung der Benutzungsordnung. Die Basis
für diese Form der Nutzung ist in unseren Hinterredenbeträgen. Nachdem wir es also erst mal festgestellt haben, was wir bereitstellen dürfen, ist dann quasi die nächste Frage, wie stellen wir es bereit? Dabei ist die Leitfrage für uns auch erst mal, warum sollte denn überhaupt jemand quasi sich unsere Kläder anschauen wollen? Wenn jetzt
zum Beispiel das Internet Archive oder so einfach öffentlich, also auch wegen der anderen rechtlichen Stellung oder anderen Umgangs damit jedenfalls Sachen einfach, eine sehr viel breitere Palette an Homepages zur Verfügung stellt. Dabei würden wir davon ausgehen,
dass man zu uns kommen könnte, weil wir zum einen tiefere Crawls anfertigen, die im Rahmen des möglichen Qualitätsbesicherts sind. Aber gewissermaßen kann man natürlich auch was der Notendetung machen und der Vorteil davon, dass wir eben so eine kuratierte Auswahl an Seiten ist, ist, dass wir einen Browsingzugang dafür zur Verfügung
stellen können und das haben wir schon umgesetzt. Also Basiszugang zum Internet Archive auf Basis der Open-Source-Software by Wayback. Dabei kann man dann eben sehen, welche grundsätzlichen Sammlungen wir haben, also SPD, Gewerkschaften, andere Organisationen und kann dann darin, hat dann in der Sammlung einen Überblick über die Seiten, die wir regelmäßig einsammeln,
wo man sich durch die Zeitschnitte klicken kann. Beziehungsweise bei Twitter, da archivieren wir monatsweise und dort kann man sich dann eben in den Kanälen monatsweise anschauen, was wir da haben und sich da durchklicken. Muss man aber sagen, dass das natürlich
ein bisschen schade ist, nur das anzubieten, denn archivierte Webseiten bieten jetzt als strukturierte digitale Daten eigentlich so viel mehr an Möglichkeiten, was man damit noch so machen könnte. Das ist hier jetzt nur mal so ein kleiner Überblick, was man so machen könnte. Das haben wir nicht alles umgesetzt. Das werden wir auch sicherlich
nicht alles umsetzen und man muss außerdem sagen, dass der einen unseren Überlegungen wie letztlich auch Literatur angewiesen sind, weil wir an tatsächlichen NutzerInnen, die zu uns kommen, das Webarchiv und sagen, da sind die Erfahrungen sehr rar. Insofern
haben wir uns eben die Literatur nur angesehen, aber haben jetzt quasi auf Basis von dieser Anforderungsanalyse sozusagen uns jetzt entschlossen, noch einen zweiten Zugang umzusetzen. Das ist bisher nur geplant. Was Sie jetzt hier sehen, das ist erst mal nur so ein Testkorpus, wo wir das jetzt mal testweise ans Laufen gebracht haben.
Und zwar ist das mit der ebenfalls Open-Source-Software Solar Wayback. Die bietet eben die Möglichkeit, also der Name legt das ja schon mal, also da wird eben ein Solar Index angelegt und auch Basis dieses Solar Index ist eine Vortext-Suche möglich in den archivierten Webseiten, dann auch eine facetierte Suche. Das war eben so eine Grundanforderung,
die wir zumindest auch zumindest jetzt, die kennen wir auch konkret von Kollegen aus dem Haus, die das sich wünschen, quasi als Vortext-Suche. Daneben bietet diese Software auch einfach noch schöne andere Möglichkeiten, wie zum Beispiel so Netzwerkanalysen, einfach von Haus aus mit. Aber der zweite Hauptgrund sozusagen, die zweite Anforderung,
die Solar Wayback umsetzt, ist, dass man sich Suchergebnisse nicht nur im Backgrund exportieren lassen kann, sondern zum Beispiel auch im CSV. Und damit, das ist unsere Reaktion ein bisschen darauf, dass in der Literatur immer wieder festgestellt wird, dass das Standard-Webarchivierungsformat, das WAG-Format selbst für technisch versierte
Digital Humanities-Forscher immer noch eine relativ hohe Hürde darstellt. Muss man aber, und damit komme ich jetzt noch mal auf die Quellenkritik, die eben auch im Bereich des Webarchivs eine Rolle spielt. Also man braucht natürlich nicht nur technische Kenntnisse, um mit Webarchivierten Webseiten jetzt
zu forschen, sondern es braucht natürlich auch das Verständnis dafür, dass solche archivierte Webseiten eine konstruierte Quelle sind, sogar eine mehrfach konstruierte Quelle. Ich habe jetzt mal ein einigermaßen plastisches Beispiel rausgesucht,
dafür die zeitlichen Infokurrenzen, die bei so einem Archivierungsvorgang entstehen. Also man sieht hier jetzt diesen Tweet vom 26. Dezember 2018, wo sich irgendjemand über die Wahlkompanie der SPD beschwert. Und man sieht aber hier den Nutzernamen, in dem eben diese Hashtags No COVID vorkommen, die man 2018 sicherlich nicht genutzt hätte.
Also hier ist es relativ deutlich, dass das da im Vorgang der Archivierungkonstruktion besteht. Und wenn man jetzt unten sieht, dass steht dieses erzeugt am Sohn-Sophiten, das wird dankenswerterweise durch das Tät von Herrn Maywitz auch mitgeschrieben,
quasi mit in die Datei geschrieben, auch wann wir das eingesammelt haben. Aber das ist natürlich etwas, was NutzerInnen letztlich wissen müssen, wo sie das nachschauen können. In dem Fall ist es jetzt auch etwas, was man hier direkt im Digital-Leses halt sehen kann, also direkt in der Datei. Andere Sachen, wie zum Beispiel die Grenzen der Sammlung, also entweder die, die wir sehr besetzen, weil wir sagen, hier definieren wir
die Grenze dessen, was wir einsammeln oder technische Grenzen, weil einfach was nicht mitkommt. Um das einzusehen, muss man im Prinzip auch wieder in die Metadaten schauen, die wir wiederum an anderer Stelle haben. Das ist dann wiederum verlegt auch. Oder man muss sogar in die Log-Dateien, die man auch erst mal wieder lesen können muss.
Damit sind wir nicht bei der letzten Folie, nämlich letztlich auch bei der Frage, die uns über die Frage hinaus, wie können wir die Anforderungen der verschiedenen Staaten sinnvoll kombinieren. Kommt eben auch die Frage, wie gehen wir mit den Grenzen zu anderen Disziplinen um, beziehungsweise um es ein bisschen konstruktiver zu formulieren.
Wie gestalten wir die Schnittstelle zwischen den Gedächtniseinrichtungen und der Forschung? Vielen Dank.