We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Einheit in der Vielheit: Edition, Forschungsdaten und computergestützte Analysen zu Alexander von Humboldts Kosmos-Vorträgen

00:00

Formale Metadaten

Titel
Einheit in der Vielheit: Edition, Forschungsdaten und computergestützte Analysen zu Alexander von Humboldts Kosmos-Vorträgen
Serientitel
Anzahl der Teile
4
Autor
Lizenz
CC-Namensnennung 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache
Produzent
Produktionsjahr2023-2024
ProduktionsortBerlin

Inhaltliche Metadaten

Fachgebiet
Genre
Abstract
Der Vortrag präsentiert die wichtigsten Ergebnissen meiner kürzlich an der Humboldt-Universität zu Berlin erschienenen Dissertation sowie die zu deren Erarbeitung angewandten Methoden. Die Präsentation fokussiert auf den Einsatz verschiedener Werkzeuge aus dem Bereich des Natural Language Processing (NLP) sowie im weiteren Sinne der Digital Humanities (DH) zur Bearbeitung und heuristischen Beantwortung literatur- und editionswissenschaftlicher Fragestellungen. Analysiert wird ein etwa 3500 handschriftliche Seiten umfassendes Volltextkorpus zu Alexander von Humboldts sogenannten Kosmos-Vorträgen (Berlin, 1827/28). Da Manuskripte des Vortragenden nicht vollständig und nicht in ihrer ursprünglichen Form überliefert sind, stellen die im Korpus enthaltenen Mitschriften, Nachschriften und deren Abschriften aus dem Kreis der Hörerinnen und Hörer die wichtigsten Quellen zu den Inhalten der Kosmos-Vorträge dar. Christian Thomas ist Wissenschaftlicher Mitarbeiter im Akademienvorhaben „Alexander von Humboldt auf Reisen – Wissenschaft aus der Bewegung“ an der Berlin-Brandenburgischen Akademie der Wissenschaften sowie im Akademienvorhaben „Propyläen – Goethes Biographica“ an der Klassik Stiftung Weimar. Seine Arbeitsschwerpunkte liegen im Bereich Digitaler Editionen und Korpora. Web: https://www.bbaw.de/die-akademie/mitarbeiterinnen-mitarbeiter/thomas-christian/ Literatur: Christian Thomas: „… ein Gemisch von Gehörtem und selbst Zugeseztem“. Nachschriften der ‚Kosmos-Vorträge‘ Alexander von Humboldts: Dokumentation, Kontextualisierung und exemplarische Analysen. Dissertation, Humboldt-Universität zu Berlin: edoc-Server, Version 1.0 vom 1. November 2023. DOI: 10.18452/27521.
Schlagwörter
BerlinComputeranimation
Computeranimation
BerlinComputeranimation
Computeranimation
Computeranimation
Computeranimation
Computeranimation
Computeranimation
Computeranimation
Computeranimation
BerlinComputeranimation
Computeranimation
Computeranimation
TabelleComputeranimation
ComputeranimationDiagramm
Computeranimation
Computeranimation
Technische Zeichnung
BerlinComputeranimationFlussdiagramm
Am 6. Dezember 1827, also genau heute vor 196 Jahren, kommt es vor dem erst kürzlich eröffneten,
neu erbauten Gebäude der Singakademie, heute Sitz des Maxim-Walking-Theaters, hier in unmittelbarer Nachbarschaft, zu einem Menschenandrang, sodass das Zuströmen der Menschen und Kutschen im Vorfeld durch Gendarmes zu Pferde und Polizeikommissäre vor dem Hause geregelt werden muss, wie der Journalist Ludwig Börne seiner Freundin Janet Wohl berichtet.
Die Vossische Zeitung schreibt am 7. Dezember rückblickend, dass der Saal vor Beginn bereits durchaus angefüllt war, während vielleicht noch einer ebenso großen Anzahl von Personen wegen mangels an Raum der begehrte Zutritt nicht hatte gestattet werden können. Wie schon bei der
Öffnung seines ersten Kurses von Vorträgen über physikalische Geografie, gut einen Monat zuvor wollen mehr Menschen den berühmten Naturforscher und Weltreisenden Alexander von Humboldt sehen und hören, als es das Fassungsvermögen des Saals erlaubt. Und dies, obwohl Humboldt mit dem großen Saal der Singakademie, der bis zu 1200 Personen
aufnehmen kann, den größten verfügbaren Vortragssaal gewählt hat. Die Preußische Staatszeitung schreibt in ihrer Beilage, Humboldt sei dabei weit entfernt den Zutritt zu seinen Vorlesungen durch die Erlegung irgendeines Honorars zu bedingen und dürfe zudem ganz besonders in dem zweiten Kursus, also jenem in der Singakademie, die Zuhörer
als seine Gäste betrachten, da die nicht unbeträchtliche Ausgabe für Miete und Heizung des Saals ihm allein anheimfällt. Eine weitere Besonderheit der Vorträge in der Singakademie besteht darin, dass, anders als in der preußischen Universität der damaligen Zeit, sich Humboldt an ein gemischtes Publikum richtet, das heißt Herren und Damen eingeladen
waren. Diese heute sogenannten Kosmosvorträge erscheinen bereits den Zeitgenossen und ebenso noch aus heutiger Sicht als das bedeutendste gesellschaftliche Ereignis Berlins dieser Jahre. Schon kurz nach deren Beginn war man sicher, dass die Methode
des Naturstudiums von dieser Zeit der Vorträge an eine neue Epoche ihrer Geschichte wird datieren können. Humboldt ist Stadtgespräch, seine Vorträge ein einzigartiger Triumph, wie Rüdiger Schaper in seiner Biografie schreibt. Schaper zufolge ließe sich das, was sich in 16 Vorträgen in der Singakademie vollzieht, als die Begründung der modernen
Wissenskultur verstehen. Zusammen mit seinen Vorträgen in der Akademie der Wissenschaften erreicht Humboldt, der erst im Jahr zuvor nach einem mehrjährigen Aufenthalt in Paris nach Berlin zurückgekehrt war, mit den Vortragszyklen in der Universität und in
der Singakademie das größtmögliche Publikum für seine ambitionierten wissenschaftspolitischen Pläne für die preußische Hauptstadt. Diese bewusst doppelt gehaltenen Kosmosvorträge, diese bewusst doppelt gehaltenen Kosmosvorträge, 62 Stunden in der Universität und 16 in der
Singakademie, gehören aus meiner Sicht als separate, jeweils in sich abgeschlossene und eigenständige Publikationen an eine zentrale Position in Humboldts Werkbiografien. Sie sind die erste öffentlich präsentierte Ausformung seiner sogenannten Kosmosidee, dem Plan einer
Himmel und Erde, organische und anorganische Natur, Kultur und Ideengeschichte verbindenden Beide Zyklen der Kosmosvorträge sind zudem jeweils inhaltlich vollständig, während Humboldt vor der Fertigstellung des zum Teil darauf basierenden Kosmos, Entwurf einer physischen
Weltbeschreibung, verstirbt und diesen als fünfwändiges Fragment hinterlässt. Umso überraschender, dass die wichtigsten Quellen zu den Inhalten der Kosmosvorträge bis vor wenigen Jahren zum größten Teil unerforscht, ja unbekannt waren. Da von Humboldt selbst
keine Vortragskripte in ihrer ursprünglichen Form überliefert sind, sind diese wichtigsten Quellen zweifellos die Mit- beziehungsweise Nachschriften aus dem Publikum. Diese Nachschriften, die mittlerweile fast vollständig als digitale Editionen im Deutschen Textarchiv verfügbar sind, sowie die zentralen Ergebnisse meiner Arbeit mit diesem Korpus sind Gegenstand des heutigen Vortrags. Dem Fokus der Reihe Werkzeug zur Praxis
computergestützter Forschung in den Geistes und Kulturwissenschaften entsprechend, werde ich meinen Schwerpunkt auf die digitalen Methoden und Tools legen, die ich im Rahmen meiner Dissertation anwenden konnte. Der Fokus liegt dabei auf den praxisrelevanten,
literatur- und kulturwissenschaftlich fruchtbaren Ergebnissen der eingesetzten Methoden und Verfahren. Ich werde also im folgenden Vortrag keine weiteren Einführungen in die Methoden oder kleine Tutorials zu den Werkzeugen bieten können. Diese und weitere Details können Sie doch jederzeit in meiner frei verfügbaren Dissertation auf dem E-Doc-Server
der HU finden. Die Grundlage für mein Promotionsvorhaben wurde in dem von der Exzellenzinitiative der Humboldt-Universität von 2014 bis 2016 geförderten Projekt Hidden Cosmos Reconstructing Alexander von Humboldt's Cosmos Lectures in enger
Kooperation mit dem Deutschen Textarchiv der Berlin-Bannenburgischen Akademie der Wissenschaften gelegt. Dieser Zusammenarbeit zwischen HU und BWAW ist es zu verdanken, dass Sie den allergrößten Teil der heute von mir vorgestellten Schlüsseldokumente zu Humboldts Cosmos Vorträgen in hervorragender Qualität sowohl als Faximilis als auch als
annotierte Volltexteditionen im Deutschen Textarchiv kostenfrei und ortsunabhängig abrufen können. Ich möchte Ihnen dieses Textkorpus, bestehend aus zwölf parallel editierten Dokumenten, mit einem Gesamtumfang von mehr als 3500 Seiten heute eingehender vorstellen. Wie Sie in der Übersicht sehen können, ist zum Kurs der Singakademie bisher
nur eine einzige Nachschrift bekannt, nämlich jene anonym verfasste 160-seitige Reinschrift, deren Verfasserin ich aufgrund eines Handschriftenvergleichs als Henriette Kohlrausch identifizieren konnte. Die anderen beiden Hefte zu Singakademie-Vorlesungen sind dagegen
keine eigenständigen Nachschriften, sondern Abschriften von Kohlrausch's Manuskript. Aus der Universität hingegen sind insgesamt neun Nachschriften bekannt, die Sie, bis auf eine Ausnahme, ebenso wie Henriette Kohlrausch's Manuskript vollständig im Deutschen Textarchiv editiert finden. Bevor wir uns diesen elektronischen Volltexten
und deren computergestützter Analyse zuwenden, vorab noch etwas mehr zum Kontext der Kosmosvorträge, der zum Verständnis des dann folgenden Hauptteils wichtig ist. Die Kosmosvorträge verliefen über einen langen Zeitraum zeitlich parallel, wie Sie hier anhand des Kalenders sehen können, der nur die Daten der Vorträge in
der Universität in grün und der Singakademie in rot enthält. Denken wir uns zahlreiche weitere Termine und Verpflichtungen Humboldts sowohl als Akademiemitglied als auch als Kammerherr des Königs hinzu. In der Singakademie hält Humboldt einen sehr strikten Rhythmus von einer
Vorlesung pro Woche ein. Diese finden montags von 12 bis 14 Uhr statt, also umfassen sie etwa zwei Bruttozeitstunden. Dagegen gerät Humboldt in der Universität zum Ende des Vortragszyklus hin in Zeitnot, weil der vorgegebene Rahmen des Semesters nicht ausreicht,
um all seine Themen in der angestrebten Ausführlichkeit behandeln zu können. Dadurch muss er nicht nur die gesamte eigentlich vorlesungsfreie Zeit hindurchlesen, sondern zusätzlich die Anzahl seiner wöchentlichen Termine ab Ende März, also im rechten unteren Bereich, stark erhöhen und kommt dort am Ende auf insgesamt
62 Vorträge. In der Universität liest Humboldt mittags von 12 bis 13 Uhr also nur eine Bruttozeitstunde. Zudem hatten die beiden Vortragszyklen thematisch zwar denselben Umriss, liefen jedoch zeitlich nicht synchron. Wenn Humboldt beispielsweise am Mittwoch,
dem 20. Februar 1828, in der Universität über magnetische Inklination sprach, musste er in der Singakademie nur einen Tag später, am 21. Februar, als Teil seiner mehrstündigen Vorlesung über die sogenannten Menschenrassen zur gemeinsamen
Abstammung des Menschengeschlechts referieren, um dann nur zwei Tage darauf in der Universität am 23. Februar wieder an seinen letzten Univortrag anzuschließen und die Erd- oder Polarlichter im Zusammenhang mit den zuvor erläuterten Magnetfeldern zu behandeln. Dass Humboldt seine beiden Vortragszyklen zwei stark unterschiedliche Gliederungen
zugrunde legt, ist offensichtlich eine ganz eigene Herausforderung, aber eine ganz bewusst gewählte, gewissermaßen zwangsläufige Entscheidung Humboldts. Jedenfalls scheint mir eine Aussage im Kosmos dies eindeutig zu belegen, der zufolge eben öffentliche Vorträge ein leichtes und entscheidendes Mittel darbieten,
um die gute oder schlechte Verkettung einzelner Teile einer Lehre zu prüfen. Demnach ging es ihm eben darum, herauszufinden, in welcher thematischen Abfolge sich seine Kosmosidee einer physischen Weltbeschreibung am besten entwickeln ließe. Allein schon der Umfang dieser beiden Zyklen an sich wäre ohne Notizen wohl kaum zu bewältigen gewesen,
von dem notwendigen Hin und Her-Springen zwischen ganz verschiedenen Themen zwischen Universität und Singakademie in derselben Woche einmal abgesehen. Daher musste und konnte auch aufgrund einschlägiger Sekundärquellen spätestens seit 1860 von der Existenz solcher Vortragsskripte ausgegangen werden.
Auch wenn Humboldt im Kosmos beteuert, er habe bei freier Rede nichts über seine Vorträge schriftlich aufgezeichnet. Und tatsächlich sind solche Manuskripte zu den Vorträgen in Humboldts Nachlass in Berlin und Krakau vereinzelt zu finden. Allerdings sind sie in Humboldt-typischer Manier zum größeren Teil und zum größeren
Teil offensichtlich nach Abschluss der Vorträge sehr stark überarbeitet, zerschnitten und in neuer Ordnung wieder zusammengesetzt sowie angereichert worden. Zudem sind überhaupt nur zu etwa einem Drittel der Vorträge Notizen im Nachlass zu finden.
Wir sehen hier einige Manuskripte aus dem Nachlass, an denen wir dann auch die Kennzeichnung zu den Vorlesungsstunden in der Universität finden. Daher, und eben weil sie nirgends in ihrer ursprünglichen Form erhalten sind, bieten Humboldts Notizen zu den Vorträgen an sich keine Grundlage zur Erschließung der Kosmosvorträge. Das wichtigste und vollständigste
Quellenkorpus dazu stellen daher die Mit- beziehungsweise Nachschriften aus dem Kreis der Hörerinnen und deren Abschriften dar. Als ein aus meiner Sicht zentrales Ergebnis der näheren Beschäftigung mit Humboldts Nachlass sowie den überlieferten Nachschriften im Rahmen meiner Dissertation können wir die angesprochenen, stark unterschiedlichen
Gliederungen der beiden Zyklen nun im Detail und vor allem im Vergleich miteinander konsultieren. Die in meiner Arbeit rekonstruierten Übersichten stützen sich zum einen auf Humboldts eigenen Angaben, die jedoch eher spärlich sind und oft nur die groben
Oberbegriffe verzeichnen, sowie auf die Nachschriften seiner Hörerinnen und Hörer und im Bereich der Singakademie auf ein sehr kleinteilig untergliedertes Inhaltsverzeichnis, das Otto Hufeland im Zuge seiner Abschrift des Heftes der Frau Geheimräte in Pohlrausch beigelegt hat. Ich konnte nicht nur zeigen, dass die Vorträge eben nicht thematisch aufeinander
abgestimmt nacheinander verlaufen. Humboldt also, dass an einem Tag in der Universität die Vorlesungen, die er referierte, am nächsten Tag in der Singakademie einfach nur wiederholen musste. Demgegenüber viel entscheidender ist der Befund, dass die in der Singakademie behandelten Themen oftmals erst später in der Universität behandelt wurden.
Dies widerlegt eindeutig die verbreitete Annahme, die populären Vorlesungen in der Singakademie seien durch Vereinfachung und Kontensation aus den in der Universität zu vorgehaltenen Vorträgen hervorgegangen. Tatsächlich verhält es sich für große Teile der Kosmosvorträge gerade anders herum. Zwar wurde der zweite Zyklus erst später
im Anschluss an jeden in der Universität begonnen, dennoch geht ein großer Teil der Vorträge in der Singakademie zeitlich ihrem entsprechenden inhaltlichen Pendant in der Universität voraus. Der andere wichtige Punkt betrifft den Umfang der Vorträge. Nicht nur relativiert sich das scheinbar überaus starke Missverhältnis
zwischen beiden Kursen, was deren Umfang betrifft, 62 Vorträge hier, 16 Vorträge dort, beachtet man die zeitliche Dauer von ein- bzw. zweistündigen Terminen. Damit verschiebt sich das Verhältnis auf 62 zu 32 und der Vergleich fällt also nicht mehr ganz so
dramatisch zu Ungunsten der Singakademie aus. Hinzu kommt, dass sich in einer der Nachschriften aus der Universität, verfasst von dem Rechnungsrat Gotthilf Friedrich Patzich, Humboldts ursprünglichen gegen Ende der 16. Vorlesung erläuterten Plan entdecken konnte. Aus diesem geht hervor, dass Humboldt den gesamten Zyklus auf nur 42 Termine angelegt
hatte. Bezeichnenderweise bemerkt er an derselben Stelle, Sie sehen es hier im Bild, dass man sich in solchen Dingen nur zu leicht verrechnen mag. Dies ist hier
offensichtlich auch der Fall gewesen, weshalb Humboldt gegen Ende der Vorlesungen ganze 20 zusätzliche Termine anhängen musste, um in den letztlich 62 Universitätsvorträgen das inhaltliche Panorama der physischen Weltbeschreibung vollenden zu können. Bei welchen durchaus zentralen Themen er dabei dennoch empfindlich kürzen musste, können Sie im
Detail in meiner Dissertation nachlesen. Festzuhalten bleibt aus meiner Sicht jedenfalls, dass das anvisierte Verhältnis beider Zyklen mit 42 zu 32 Stunden gar nicht so dramatisch unterschiedlich ausfallen sollte und vor allem das entgegen bisheriger Forschungsmeinungen, die Vorträge in der SING-Akademie keine vereinfachte oder kondensierte Version der
zeitlich vorangehenden Universitätsvorträge waren. Kommen wir nun im zweiten Teil des Vortrags zur Arbeit mit dem Korpus, das heißt zu dessen computergestützter Analyse. Die Dokumente sind im Volltext erfasst und im deutschen Textarchiv veröffentlicht worden.
Die Annotation der Volltexte, das heißt die strukturelle und inhaltliche Auszeichnung der relevanten Textmerkmale folgt, wie alle Dokumente im DTA, dem sogenannten DTA-Basisformat. Dieses folgt seinerseits den Empfehlungen der Internationalen Text-Encoding-Initiativ
zur Auszeichnung in der Markabsprache XML. Wir sehen das Prinzip hier in diesem Beispielparagraf illustriert. Wir können also an den Text in schwarzer Farbe alles was bunt ist an Annotationen antragen, strukturelle Merkmale, wie dieses ein Absatz, das ist ein Name und zwar vom Typ, Organisation und so weiter als Annotationen herantragen. Im Zuge des
7 Kosmosprojekts wurde das DTA-Basisformat, das zunächst nur für Druckwerke ausgelegt war, in Zusammenarbeit mit der BWAW zum DTA-Basisformat für Manuskripte erweitert. Dabei wurden Auszeichnungsmöglichkeiten für typischerweise in Handschriften vorkommende
Phänomene eingeführt, beispielsweise die vielfachen Überarbeitungsspuren, die Schreiber bzw. späterer Hände in den Manuskripten hinterlassen. Obwohl das DTA-Basisformat selbst und ebenso wie die zugrunde liegenden Richtlinien der Text-Encoding-Initiativ
bereits ausführlich und sehr anschaulich dokumentiert sind, habe ich den Transkriptions- und Annotationsrichtlinien für die Nachschriften der Kosmosvorträge ein eigenes Kapitel in meiner Dissertation gewidmet. Darin finden Sie nicht nur sehr viel spezifischere Hinweise zu den Annotationen selbst, sondern zugleich die gewissermaßen nachholende
Begründung für die dabei getroffenen Festlegungen im DTA-BF für Manuskripte, immer mit Blick auf und illustriert mit Beispielen aus diesem Spezialkorpus. Dies beginnt bereits im Bereich der Richtlinien zur Transkription. So ermöglicht es die TI und empfiehlt es das DTA-Basisformat, die Vorlage möglichst zeichengetreu und
das heißt ohne modernisierende, normalisierende oder korrigierende editorische Eingriffe zu erfassen. Diese Eingriffe werden dann, wo nötig und stets transparent dokumentiert, erst auf der Ebene der Annotation herangetragen. Mit Blick auf das Korpus der Nachschriften ist dieser Punkt auch deshalb besonders wichtig, weil hier gerade die Fehler der oftmals
anonymen oder unbekannten Schreiberinnen uns etwas über deren Vertrautheit mit dem Thema verraten können. Zudem erlaubt die konsequente und durchgehende Dokumentation abgekürzter Notationen einen Rückschluss auf den Ausreifungsgrad und Charakter der Schrift bis hin zu der These, dass es sich bei einem mit besonders vielen Abkürzungen
und Kürzungszeichen versehenen Manuskript eventuell auch um eine eilig bzw. pragmatisch schnell erstellte Abschrift handeln könnte oder auch um eine unmittelbare Mitschrift, die noch nicht in Reinschrift ausformuliert wurde. Generell ist daher von so genannten
stillschweigenden oder undokumentiert normalisierenden Eingriffen in den möglichst alle in der Handschrift beobachtbaren Phänomene vollständig erfasst werden. Dies betrifft auch vermeintlich schriftüberflächliche Merkmale. Beispielsweise lässt sich zeigen,
wie sich der Wechsel von der deutschen Korrent zu einer latinisierten Schrift, der bei der Erfassung handschriftlicher Dokumente oft vernachlässigt oder mit anderen Arten der Vorhebung typografisch vermengt wird, gezielt einsetzen lässt, um aus den entsprechend konsequent annotierten Daten die Grundlage für ein umfassendes Personen-, Orts- und Sachregister zu generieren. Ebenso sollte der Wechsel der
Schreibgeräte beispielsweise von Tinte zu Bleistift erfasst werden. Anhand dessen lässt sich etwa in Gustav Pater's Nachschrift zeigen, dass dieser zum Bleistift greift, wo immer ihm ein Sachverhalt unsicher erscheint oder er seine Notizen aus
anderen Quellen ergänzen muss. Die Verteilung seiner Bleistifteingriffe über das gesamte Dokument zeigt, dass diese Unsicherheiten vor allem im Bereich der Pflanzengeografie bestanden. Ein Befund, der sich aufgrund einer sehr einfachen Abfrage der entsprechenden Annotation gewinnen ließ. In anderen Manuskripten zeigt der Wechsel des
Schreibgerätes zugleich einen Bearbeiterwechsel an, wenn der Text des ursprünglichen Schreibers, also von Dritten überarbeitet wurde. Wir können dadurch untersuchen, wie verschiedene Schreiber mit je unterschiedlichen Aufgaben bzw. Rollen einen gemeinsamen Text herstellen. Der Text des möglicherweise beauftragten Schönschreibers,
der die Reinschrift anfertigt, wird also von einem offensichtlich kenntnisreicheren weiteren Schreiber überarbeitet, möglicherweise der Auftraggeber der Reinschrift. Für eine anonym überlieferte Nachschrift, die die Grundlage einer
1934 erschienenen Druckausgabe geworden ist, konnte ich aufgrund wiederum vergleichsweise einfacher Abfragen zeigen, dass diese hier im Bild zu sehenden Eingriffe sämtlich im Verklegung geschehen sind. Diese Eingriffe geben also zum Teil mehr als 100 Jahre späteres Wissen wieder und jedenfalls nicht das Manuskript aus der Zeit der Kosmosvorträge,
wie die Edition dies suggeriert. Überhaupt sind die Überarbeitungen mit großer Vorsicht zu genießen, nicht nur, weil sie zum Teil selbst fehlerhaft sind, sondern auch, weil sie nicht sämtlich und nicht immer korrekt in die Druckfahne übertragen wurden, womit die gesamte Edition wissenschaftlich unbrauchbar wird. Zu den semantischen
Auszeichnungen im XML-Markup gehören beispielsweise die Personennamen. Diese wurden mit Normdaten aus der gemeinsamen Normdatei, die bei der Deutschen Nationalbibliothek geführt wird, identifiziert. Somit können Sie über das gesamte Korpus hinweg einen
Personenregister direkt aus den XML-Quellen erstellen, wie Sie dies hier umgesetzt sehen. Für das Nachschriftenkorpus war es mir dabei besonders wichtig, auf Korrekturen der oft abweichenden bzw. fehlerhaften Schreibweisen zu verzichten und diese erst im Zuge der Annotation anhand der Normdaten zu vereinheitlichen. Somit lässt sich abschätzen, wie gut oder
weniger gut einzelne Schreiber mit den wissenschaftlichen Autoritäten, die Humboldt ins Feld führt, vertraut waren. Zu denen bieten Normdaten einen einfachen Weg der Vernetzung von Dokumenten, auch über Korpusgrenzen hinweg. Das 7-Kosmos-Personenregister
ist dadurch vollständig und vollautomatisch mit dem Personenregister der Berliner Edition Humboldt digital verknüpft. Die Schnittmenge des Personals zwischen den Dokumenten der beiden Editionsvorhaben verspricht Aufschlüsse über Humboldts Arbeitsweise und seine Gewährs Männer und Frauen. Das erwähnte Personenregister ist zudem ein Zugangsweg, über den die
parallel nebeneinander edierten Dokumente miteinander vernetzt werden können. Eine also sämtliche Volltexte miteinander abgeglichen werden und ein möglichst einheitlicher,
konsistenter Text hergestellt wird. Dies war bzw. ist auch weiterhin durchaus üblich, insbesondere im Bereich printorientierter Editionsverfahren, wo ein Leittext ausgewählt wird, dem mehrere weitere Textzeugen untergeordnet werden, die wiederum nur in Auswahl im Variantenapparat erscheinen. Oder wo ein sogenannter idealer Text aus
mehreren Textzeugen konstruiert wird. Ich wende mich in einem eigenen Kapitel meiner Dissertation gegen diese Ansätze nicht nur, weil im digitalen Medium die editorialen nicht mehr den Platzbeschränkungen der Seitenbasierten Druckedition unterworfen sind. Dies ist zwar
auch zutreffend, aber noch wichtiger schien es mir zu zeigen, dass diese Ansätze grundsätzlich nicht zu einem aus editorischer und historischer Perspektive zufriedenstellenden Ergebnis führen können. Lassen Sie mich dies anhand des Nachschriftenkorpus illustrieren. Allein schon der
stark unterschiedliche Umfang der Nachschriften lässt an deren Vergleichbarkeit zweifeln. Sie sehen hier im Vergleich die einzelnen Nachschriften zum Universitätszyklus. Alle hier markierten Dokumente sind vollständig in dem Sinne, dass jedes von ihnen sämtliche 62
Stunden der Universitätsvorlesung wiedergibt. Gustav Pardey's Nachschrift mit mehr als 800 Seiten, ebenso wie jene von Peter Theophil Ries auf nur 93 Seiten. Sie können sich leicht vorstellen, dass die Abweichungen zwischen diesen beiden Dokumenten und den weiteren dabei zu berücksichtigenden Nachschriften durch einen einfachen Variantenapparat schlichtweg
nicht dokumentiert werden können, ohne einen großen Teil der Überlieferung in der Edition zu unterdrücken. Als Vergleichseinheiten sehen Sie jeweils die Seiten und Zeichen sowie die Tokenzahl der einzelnen Dokumente. Als die am besten geeignete Vergleichsgröße hat sich
letztere erwiesen, also die Anzahl der Tokens, worunter sie sich ganz grob Einheiten einzelner Wörter und Satzzeichen vorstellen können. Hierbei fallen Unterschiede in der Seitenzahl, die sich allein aufgrund des Papierformats ergeben oder dem mehr oder weniger großzügigen Rand, der auf jeder Seite gelassen wird, geschuldet sind, nicht ins Gewicht. Ebenso
oder eher kleine Schmaleschrift der einzelnen Schreiber, sowie ob sie zu mehr oder weniger starken Abkürzungen neigen, was mit Blick auf die Zeichenzahl letztlich einen großen Unterschied machen kann. Daher vergleichen wir hier und auch in späteren Beispielen am
lieesten anhand der automatisch ermittelten Tokenzahl. Doch zurück zum Versuch einer Koalition zweier oder mehrerer Textzeugen aus dem Korpus. Denn die Überlegungen zur fehlenden Vereinbarkeit der Texte aus den einzelnen Dokumenten lassen sich auch computergestützt untermauern. Vielleicht erscheint Ihnen der grobe Vergleich anhand
des Umfangs der Dokumente, aus dem ich die fehlende Vergleichbarkeit ableiten möchte, auch nicht intuitiv oder an sich überzeugend. Zunächst könnte man ja durchaus annehmen, es müsste doch, da alle dieselbe Vorlesung in denselben Worten Humboldts gehört und und dann nachgeschrieben haben, in etwa denselben Wortlauten in den Dokumenten geben. Wenn auch
mit mehr oder weniger großen Lücken. Müsste es nicht also viel mehr Stellen, wie die von mir im Titel des Vortrags verwendete und meiner Dissertation als Motto vorangestellte Einheit in der Vielheitpassage geben. Denn diese ist tatsächlich relativ weit
übereinstimmend zwischen den einzelnen Nachschriften und sie ist sowohl in Humboldts Nachlass überliefert als eine der wenigen ausformulierten Textpassagen und später von ihm auch im Kosmos ausgeführt worden, sodass wir hier tatsächlich alle diese Textzeugen mithilfe
von Tools wie Juxta oder Collate X automatisch kollationieren können. Im Bild rechts sehen Sie die sehr schön übersichtliche Alignment Table aus Collate X, die die Gemeinsamkeiten und Abweichungen der Textzeugen untereinander aliniert darstellt. Um nun weitere solche
überhaupt zur Kollation geeignete, das heißt ausreichend ähnliche Textpassagen zu ermitteln, habe ich mich des gewissermaßen umgekehrten Verfahrens bedient und nicht nach kleinteiligen Abweichungen, sondern nach mit größerer Toleranz ermittelten Gemeinsamkeiten der Textzeugen gesucht. Dazu habe ich also eine Plagiatsanalyse und zwar mit der
notwendigen Preprocessing der Daten habe ich die acht infrage kommenden Dokumente, zu denen ein Volltext vorliegt, anhand ihrer XML Struktur zunächst in Einzelstunden gesplittet,
sodass jede der maximal 62 dokumentierten Vortragsstunden ein einzelnes Dokument bildet. Diese etwa 400 Dokumente wurden bei der Plagiatsuche miteinander verglichen. Im Bild sehen Sie die Visualisierung von textidentischen Passagen in Rot durch das Tool.
In den allerwenigsten Fällen sind allerdings die Übereinstimmungen so groß wie im unteren Bereich zu sehen. Ganz im Gegenteil, zumeist liegt die Übereinstimmung im einstelligen bis niedrigen zweistelligen Prozentbereich. Die Grafik unten zeigt die Ergebnisse des Vergleichs von Gustav Pardijs Nachschrift mit einem anonym verfassten Heft. In der Regel
liegen auch hier die Übereinstimmungen, bei denen für das gesamte Korpus typischen Werten zwischen 3 und 13 Prozent. Nur in einzelnen Stunden schnellte Wert nach oben bis hin zu mehr als 80 oder 90 Prozent. Durch einen Close Reading Vergleich konnte ich diese Ergebnisse
darauf zurückführen, dass hier schlicht der eine vom anderen abgeschrieben hat. Offenbar hat der anonyme Schreiber einzelne Stunden versäumt oder diese daher und diese daher oder aus anderen Gründen aus Gustav Pardijs Heft kopiert. Überall wo dies nicht der Fall ist, sind die Nachschriften so individuell, dass eine Kollation nicht möglich ist. Und daher ist,
will man nicht letztlich immer subjektive Gründe für die Vernachlässigung oder Bevorzugung einzelner heranziehen, allein die parallele Edition der vollständigen Textzeugen der Überlieferungssituationen angemessen. Dass dabei auch die größte
Textmenge noch lange keine Vollständigkeit garantiert, zeigt ein weiteres Experiment, das sich ohne weiteres auf die vielen ähnlich gelagerten Überlieferungssituationen übertragen lässt. Also man immer Nachschriften als Quellen für mündliche Vorträge herangezogen werden. Das Experiment können Sie selbst auch lesend nachvollziehen, wenn Sie einmal
einen der Kosmos Vorträge laut und in angemessener Geschwindigkeit vorlesen. Sie werden feststellen, dass Sie für jeden der auf etwa eine Stunde angesetzten Universitätsvorträge auf sehr viel weniger Redezeit kommen werden. Ich wollte dies genauer untersuchen und habe dazu die erwartbare Zahl an Tokens, grob gesagt geäußerten Worten,
je Vortrag berechnet. Dabei gehe ich für eine mündliche Präsentation von einer Sprechgeschwindigkeit von etwa viereinhalb Silben je Sekunde aus sowie davon, dass ein vergleichsweise komplexer Text etwa zwei Silben pro Wort enthält.
Somit ergibt sich eine Anzahl von etwa 134 Wörtern, die pro Minute Sprechzeit geäußert werden. Das bedeutet, dass pro Vortrag in der Universität, gehen wir mit akademischem Viertel von einer Sprechzeit von 45 Minuten aus, etwa 6000 Tokens zu erwarten wären. Für die doppelt so langen Vorträge in der Singenakademie wären es
entsprechend etwa 12.000 Tokens. Tatsächlich aber geben die Nachschriften Gustav Partheis für die Universität und Henriette Kohlrausch für die Singenakademie mit durchschnittlich etwa 2100 bzw. 2400 Tokens je Vortrag nur etwas mehr als ein Drittel bzw. sogar nur ein Fünftel
der erwartbaren Tokenanzahl wieder. Das unterstreicht zum einen den großen Anteil, den die NachschreiberInnen an der Textkonstitution haben, so dass sie durchaus als Co-AutorInnen
oder zumindest mit HerausgeberInnen der Kosmosvorträge gelten können. Denn den NachschreiberInnen gelingt es ja trotz der umfangreichen Kürzungen und Auslassungen, einen in sich konsistenten Text zu erzeugen, der nach unserem Eindruck als LeserInnen durchaus Humboldts Kosmosvorträge wiedergibt. Zum anderen zeigt das Experiment einmal mehr,
wie problematisch der Begriff der Vollständigkeit ist und wie fehlgeleitet er als Ziel editorischer Bemühungen definiert bzw. als Auswahlkriterium des besten Textzeugen verwendet wird. Ebenso wie den Begriff der Vollständigkeit sehe ich nach meiner Auseinandersetzung mit dieser
Textgattung den Begriff der Authentizität von Nachschriften äußerst kritisch, was ich im entsprechenden Kapitel 7 meiner Dissertation eingehender darlege. Stattdessen argumentiere ich dafür, dass es mehrere an sich gleichwertige Versionen der Kosmosvorträge gibt, die parallel ideiert und rezipiert werden sollten. Sehr interessant ist es auch,
sich die Verteilung der Textmenge über den gesamten Vortragszyklus hinweg anzusehen. Denn die Nachschriften weichen hinsichtlich des Umfangs nicht nur im Vergleich miteinander stark voneinander ab, sondern auch innerhalb der einzelnen Textzeugen gibt es in dieser
Hinsicht eine große Varianz. Im Bild sehen Sie die Verteilung der Anzahl der Tokens je Vortragsstunde für jedes Hörermanuskript zum Universitätszyklus. Für mich war es nicht nur überraschend zu sehen, wie stark die Unterschiede im Einzelnen ausfallen, sondern beispielsweise auch, dass keiner der Nachschreiber in der Universität zum Ende hin
immer weniger Text produziert, also dass niemand müde wird, als Humboldt fast täglich liest und sein Publikum dadurch besonders stark fordert. In Henriette Kohlrauschs Nachschrift aus der Singerakademie sind die elfte Vorlesung zu den Menschenrassen und die
Vorlesungen 12, 13 und 14 zur Geschichte der Weltanschauung die umfangreichsten. Vielleicht hatte sie daran einfach mehr Interesse und in diesem Sinne mehr Bemerkens- und Notierenswertes gefunden, als in der dritten und vierten Innere Beschaffenheit der Erde, Erdbeben, Vulkane und so weiter, sowie der sechsten Vorlesung zur Klimatologie. Vielleicht
war es auch einfach leichter zu erfassen bzw. eben einfacher wieder zu einem Fließtext herunterzuschreiben, was Humboldt in den sicherlich mehr diskursiven Teilen in meines Erachtens nicht davon auszugeben, dass Humboldt ausgerechnet zu den zuletzt
genannten Themen weniger gesprochen hätte. Es ist eben nur weniger in der Nachschrift enthalten. Auch dieses Schwanken hinsichtlich des Textumfangs je Vortragsstunde können sie natürlich auch im Selbstversuch durch Vorlesen nachvollziehen. Sie können es aber auch ebenso gut und ganz exakt anhand der Forschungsdaten nachprüfen, die ich
als integrale Bestandteile meiner Dissertation auf GitHub veröffentlicht habe. Dort finden Sie nicht nur die TI-XML-Volltexte aller Nachschriften aus dem Deutschen Textarchiv, sondern auch die von mir auf dieser Grundlage erstellten präprozessierten Daten, beispielsweise die in Einzelstunden gesplitteten und automatisch normalisierten Dateien,
wiederum im XML- aber auch im HTML-Format, das für Tools wie CopyFind und viele andere als Input besser geeignet ist. Sie finden auch alle Ergebnisse als Dateien und Statistiken in der von mir durchgeführten Plagiatsuche und darüber hinaus finden Sie
vorbereitete Kollationssets derjenigen Einzelstunden, die sich als Resultat dieser Suche als überhaupt sinnvoll kollationierbar erwiesen haben. All dies ist erläutert in der kommentierten Inhaltsübersicht. Sie können mir direkt auf GitHub sehr gern über sogenannte Issues melden, wo etwas fehlt oder fehlerhaft ist. Ebenfalls verlinkt ist eine kommentierte
PDF-Version meiner Promotionsschrift, in der Sie gerne Hinweise auf weitere Quellen, Überlegungen und natürlich auch Fehlermeldungen sehr gern anbringen können. Abschließend möchte ich noch einen Ausblick geben. Im Wesentlichen eine Ideenliste dessen,
was ich mir wünschen würde, dass nun im Anschluss an meine Arbeit mit den Daten geschehen kann. Sie werden spätestens jetzt festgestellt haben, dass die Auseinandersetzung mit den Inhalten der Vorträge in meiner Arbeit nicht stattfinden konnte, sondern es deren Ziel war, die Grundlage dazu bereitzustellen und bestmöglich zu
dokumentieren. Dass diese Auseinandersetzung also erst jetzt so richtig beginnen kann. Daher habe ich das letzte Kapitel meiner Arbeit auch optimistisch mit Aufbruch statt Abschluss betitelt. Zum einen hoffe ich natürlich, dass künftig die von mir editierten Textzeugen dafür konsultiert werden, anstelle der unzuverlässigen
früheren Printedition. Zum anderen gibt es eine ganze Reihe von Dingen, die ich selbst nicht mehr durchführen konnte. Etwa um nur bei Verfahren zu bleiben, über die Sie im Verlauf dieser Vortragsreihe noch mehr erfahren werden. Topic-Modeling-Untersuchungen, worüber Sie im Vortrag von Melanie Alltage genaueres
und auch kritisches hören werden, um einen noch besseren und dokumentgetriebenen Einblick in die thematische Vielfalt dieser allumfassenden Kosmosvorträge zu gewinnen. Im Bereich der Text-Reuse-Detection wäre es interessant zu schauen, welche in den Nachschriften belegten Textpassagen in anderen Publikationen
Humboldts wieder auftauchen. Welches also die Schlüsselstellen, wie es im Vortragstitel der Kollegen Arnold, Jeschke, Kraut und Matos zu diesen Verfahren heißt, welches also die Schlüsselstellen der Kosmosvorträge sind. Hierfür bieten die selbstständigen Publikationen Humboldts im deutschen Textarchiv
sowie das sehr umfangreiche Berner Corpus sämtlicher unselbständiger Schriften inzwischen eine gute Ausgangsbasis. Von Clemens Neudecker werden Sie den aktuellen Stand der OCR-Entwicklung erfahren, wobei zuverlässige Ground Truth-Daten ebenso wie im Bereich der HTR, also der Handwritten Text Recognition, unerlässlich zur Verbesserung der Verfahren sind.
Auf Grundlage der annotierten Vortexte aus dem Hidden-Kosmos-Projekt wurde bereits erfolgreich ein HTR-Modell für Transkribus trainiert und könnte nun auf die beiden noch nicht im Volltext erfassten Hefte angewendet werden. Zum einen Ludwig Lohdes Nachschrift der Universitätsvorlesung,
die in der Berliner Staatsbibliothek verwahrt wird, sowie eine andere anonyme Abschrift des Heftes der Frau Geheimräte in Kohlrausch aus der Singakademie, die sich in Norwegen im Privatbefindet. Insgesamt so hoffe ich, dass weitere Projekte zukünftig zeichengetreu und ohne stillschweigende Eingriffe transkribieren werden, so wie ich es im Kapitel 8 meiner Arbeit ausführe
und diese Daten auch zur Nachnutzung bereitstellen. Die Art und Weise, wie wir Nachschriften ideieren, von der Texterfassung und der Annotation, der Aufbereitung der Daten bis hin zur Publikation, vorzugsweise in parallelen digitalen Editionen und daran anschließend auch, wie wir Nachschriften
rezipieren, sollte sich aus meiner Sicht grundlegend ändern. Das Bereitstellen von Daten zur Nachnutzung ist natürlich auch die Grundlage für ein historisches Vorlesungs-Korpus mit Nachschriften ganz verschiedener Vortragsreihen, wie es Michael Prinz in Zürich begonnen hat aufzubauen.
Ein solches Korpus würde es nicht nur erlauben, die noch lange nicht abschließend bestimmte Textgattung Nachschrift eingehender und im Vergleich über verschiedene Vorträge, Zeiträume und Überlieferungszusammenhänge hinweg zu untersuchen. Dabei kämen auch Fragen der konzeptuellen Mündlichkeit und Schriftlichkeit in den
Blick, besonders dort, wo zusätzlich zu den Mit- oder Nachschriften der mündlichen Vorträge auch eine vom Vortragenden autorisierte, schriftlich verfasste Version existiert. Im Falle Humboldts wäre es etwa interessant, daraufhin die Nachschriften seiner Hörerinnen mit dem zu vergleichen, was er im Kosmos als Eröffnungsvortrag aus der Sing-Akademie
ausgibt. Schließlich steht 2027 das 200-jährige Jubiläum der Kosmos-Vorträge an. Und nicht nur mit Blick auf das buchsozialisierte Publikum wäre es natürlich schön, wenn es zuverlässige Print-Ausgaben einzelner Nachschriften geben würde. Natürlich immer mit transparenter und vollständiger Rückbindung an das gesamte
Textkorpus. Christian Kassung und ich haben 2019 mit der Ausgabe der Nachschrift Kohlrausch aus der Sing-Akademie eine solche Edition vorgelegt, die unmittelbar auf der XML-Fassung aus dem DTA basiert. In gleicher Weise könnte eine oder auch mehrere Nachschriften aus der Universität
für Druckausgaben genutzt werden. Die Daten jedenfalls stehen unter einer freien Lizenz dafür bereit. Etwas kleiner geträumt wäre eine Hörbuch-Fassung von Henriette Kohlrausch's Text sehr schön. Natürlich gelesen von einer starken Frauenstimme. Übersetzungen ins Chinesische, ins Englische. Alles, was man sich wünschen kann, wünsche ich mir auch.
Und schließlich gibt es noch ein ganzes Kapitel, das sich ursprünglich eingeplant und auch etwa zwei Drittel fertiggeschrieben hatte, aber nicht abschließen konnte. Und zwar zu den Abbildungen, die sich in einigen Nachschriften finden. Manche davon nur in einer einzigen, andere in mehreren Versionen, in verschiedenen
voneinander unabhängig entstandenen Heften. Hier wären Fragen, nach deren Funktion im Bild Textgefüge und nicht zuletzt danach, welche Vorlagen hierfür existierten und ob Humboldt selbst diese auf irgendeine Weise im Vortragssaal bereitstellen konnte. Ich konnte dieses Kapitel aus Mangel an Zeit und ehrlich gesagt auch Mangel der
Expertise nicht fertigstellen, gebe aber alles, was ich zusammengetragen habe, sehr gerne weiter an berufende und interessierte Vorschälen, die damit weiterarbeiten möchten. Sie sehen hoffentlich, dass die Arbeit an und mit den Daten noch keineswegs zu Ende ist. Ich bin es jedenfalls für heute und danke Ihnen sehr für Ihre
Aufmerksamkeit und Ihre Geduld.