Spartenübergreifende Recherche im Regionalportal. Überlegungen zur Integration heterogener (Meta-)Daten am Beispiel Saxorum
This is a modal window.
The media could not be loaded, either because the server or network failed or because the format is not supported.
Formal Metadata
Title |
| |
Title of Series | ||
Number of Parts | 13 | |
Author | ||
Contributors | ||
License | CC Attribution 3.0 Germany: You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor. | |
Identifiers | 10.5446/69609 (DOI) | |
Publisher | ||
Release Date | ||
Language |
Content Metadata
Subject Area | ||
Genre | ||
Abstract |
| |
Keywords |
BiblioCon246 / 13
12
00:00
Computer animationLecture/Conference
00:15
Computer animation
09:28
Computer animation
18:35
Lecture/ConferenceComputer animation
Transcript: German(auto-generated)
00:06
Vielen Dank liebe Frau Sommer für die freundliche Einführung. Ich habe heute einen kleinen Blick auf einen Work in Progress mitgebracht, also ich werde Ihnen nichts fertiges abgeschlossenes präsentieren heute, sondern tatsächlich auch so einen kleinen Blick in Überlegungen in einem Maschinenraum. Deswegen werde ich
00:25
trotz der Kürze der Zeit mir erlauben, mit ein paar Vorüberlegungen zu starten. Einfach vor dem Hintergrund, warum befasst man sich mit so einem Thema abseits davon, dass wir uns als Bibliotheksmenschen natürlich gerne und jederzeit mit Daten befassen, in den unterschiedlichsten Zuständen, aber
00:41
warum muss das gerade in einem Regionalportal sein? Genau, dann ein kurzer Blick ganz überblicksartig auf diese Szene. Was sind das eigentlich Regionalportale im deutschsprachigen Raum? Den Werbeblock hat Frau Sommer eben auch schon gebracht für heute Nachmittag, also gehen Sie auch gerne damit hin und dann in zwei weiteren Punkten
01:01
abschließend einen Blick eben auf Saxorum als ein Beispiel in Sachsen. Ja, ich möchte beginnen mit ein paar Überlegungen dazu, dass eben diese Umgang mit Daten nicht nur ein technisches Thema ist, als dass wir das oft verstehen, sondern eben auch ein kulturelles Thema. Felix Stalder ist ein Kulturwissenschaftler, der sich relativ intensiv mit
01:22
diesem Thema befasst hat, also Digitalisierung und Digitalität als kulturwissenschaftlicher Prozess und er hat einige Überlegungen dazu angestellt, was so Grundformen von Digitalität sind in unserer Zeit. Da geht er von dem Begriff der Unübersichtlichkeit aus, damit sind wir schon relativ nah an der Heterogenität, die ich dann im Vortrag
01:40
auch weiter so ein Stück als Leitmotiv genommen habe. Digitalität bedeutet also den Wegfall von Filterfunktion vor der Veröffentlichung von Informationen. Klassische Medien verlieren an Bedeutung, jeder kann und jederzeit publizieren in den unterschiedlichsten Formen, sozusagen das Themenfeld, mit dem wir uns als Bibliotheken befassen könnten, theoretisch wird damit immer größer und
02:02
damit hängen dann auch neue Formen der Ordnung von Wissen zusammen. Diese erste Form ist nach Stalder Referentialität, also dass Menschen sich mehr persönliche Bezugssysteme erstellen, anstatt eben in klassischen Katalogen beispielsweise zu suchen, sondern sehr stark eben auf
02:23
persönliche Kontexte fixiert sind in ihrer Informationsbeschaffung, wir alle kennen den Begriff der Filterblasen, der damit zusammenhängt. Ein zweiter Punkt ist der der Gemeinschaftlichkeit, der mit dem vorherigen, dem der Referentialität verbunden ist, dass so die eigenen Filterblasen, die eigenen Systeme immer wieder auch mit anderen
02:41
konfrontiert werden, mit der Aufmerksamkeit der anderen und so in so einem ständigen Wechselverhältnis irgendwie stehen und schließlich als dritter Punkt die Algorithmizität, also die Maschinelle Ordnung oder Vorordnung zumindest von Daten und von Informationen, das kennen wir ganz klassisch von Google, das kennen wir
03:01
aber auch aus unserem Discovery System, die sozusagen bestimmte Vorannahmen treffen, technische Art und dann damit die Suchergebnisse beeinflussen. Und zusammengefasst noch mal so ein Begriff von Digitalität nach Stalder, soziale und kulturelle Praktiken in Zusammenhang mit der Digitalisierung zur Herstellung von Verbindungen
03:21
zwischen Menschen und zu Objekten, also wir sehen, das ist nicht nur ein technischer Prozess, sondern tatsächlich auch ein kultureller, der unsere Informationsbeschaffung sehr stark prägt. Was hat das nun mit Regionalportalen zu tun? Digitalisierung in diesem Sinn ist natürlich ein Prozess, der eng verbunden ist mit der
03:40
Globalisierung, also dass sich sozusagen Kontexte auflösen, weltweit werden, die stärker früher auf lokale oder regionale Bezugspunkte fokussiert waren. Es ist aber festzustellen, dass es teils als Gegenreaktion, teils als inhärente Entwicklungen auch wiederum verstärkte Hinwendungen oder Rückwendungen zu lokalen und regionalen Bezügen gibt. Das hat jemand mal als
04:03
Globalisierung bezeichnet, also diese beiden Begriffe schön zusammengefasst. Und das ist tatsächlich das, wo die Regionalportale dann ins Spiel kommen. Diese Prozesse, diese Hinwendungen werden wiederum beschleunigt durch Digitalisierung, werden intensiviert, also das ist ein ständiges Wechselspiel. Und die Landes- und die Regionalgeschichte,
04:23
bzw. die Landeskunde als Bezugsfelder von Regionalportalen sind insofern in konzeptioneller Hinsicht als Disziplin besonders von diesen Entwicklungen betroffen. Und das ist so der Ausgangspunkt unserer Überlegungen in Dresden, wenn wir uns mit diesen Themen befassen.
04:41
Zweiter Punkt, Regionalportale im Deutschpreigen-Raum. Das ist die Übersichtseite der Arbeitsgemeinschaft Deutschpreiger-Portale zu Regionalgeschichte und Landeskunde, wo sich verschiedene Akteure zusammengeschlossen haben, sich regelmäßig treffen und austauschen über die Entwicklungen in ihrem Bereich. Dort sind aktuell circa 70 Online-Angebote aufgeführt,
05:02
die einen unterschiedlichen Zuschnitt haben. Das sind große Kultur- und Informationsportale, das sind Online-Lexika, das sind Wikis, das sind Repositorien, also eine ganz große Bandbreite. Also hier ein sehr heterogenes Feld. Ebenso heterogen ist die Trägerschaft. Diese Angebote, also wir haben dort große Staatsbibliotheken,
05:23
Landes- und Unibibliotheken, wir haben aber auch Landes- und Staatsarchive, wir haben Forschungseinrichtungen, universitäre und ausuniversitäre Art, wir haben Landesämter, wir haben städtische Institutionen. Also das sind alles Einrichtungen, die auch aus unterschiedlichen Arbeitskulturen kommen und entsprechend auch aus unterschiedlichen Datenkulturen
05:41
irgendwo kommen. Und wenn es darum geht, deren Daten irgendwo zusammenzuführen, kann das eine Herausforderung sein. Heterogen ist da natürlich auch die finanzielle Ausstattung dieser Einrichtungen. Also wir können uns vorstellen, dass zum Beispiel ein Stadtarchiv da im Zweifelsfall weniger Mittel hat, als beispielsweise eine große Staatsbibliothek, um die in diesem Bereich einzusetzen.
06:02
Und auch die strukturelle Nachhaltigkeit, also wie lange werden solche Portale vorgehalten, ist da eine Frage. Was könnten nun Regionalportale erst mal ganz allgemein für eine Rolle spielen im Rahmen dieser Informationsbeschaffung, wie wir sie aktuell sehen? Andreas Rutz, der Lehrstuhlinhaber in Dresden,
06:21
für die Sächsische Landesgeschichte hat das als Gateway-Charakter bezeichnet, mit dem Ziel, vorhandene Angebote zusammenzuführen, dezentrale Elemente zentral aufwennbar und recherchierbar zu machen, sowie miteinander zu verknüpfen. Also im Blick auf die Vorüberlegung, die ich hatte, Ordnung in die Unübersichtlichkeit
06:40
irgendwie zu bringen. Das ist natürlich nun ein ganz klassisches bibliothekarisches Thema, das machen wir an vielen Stellen, immer und überall. Vor diesem Kontext der Regionalportale ist aber der besondere Punkt, dass wir eben da auch mit nicht-bibliothekarischen Daten relativ häufig zu tun haben. Woran ich dann später noch weiter eingehen werde.
07:03
Ja, das bildet dann auch so ein Stück den dezentralen Charakter der landeshistorischen Forschung ab. Das ist ein Forschungsfeld, das einerseits natürlich sehr stark von Universitätsinstituten, von Professuren geprägt wird, andererseits aber auch sehr viel von außeruniversitären Forschungseinrichtungen, Archive und Bibliotheken ganz klassisch, aber eben auch Vereine, zivilgesellschaftliche Akteure, die hier eine
07:22
Rolle spielen und sozusagen in dem Umgang mit Daten auch wieder ganz andere Voraussetzungen haben als die Institution. Aufgaben für Anbieter von solchen Regionalportalen können dann eben sein, ja, technische und organisatorische Rahmen zur Präsentation zu liefern,
07:41
Daten zu integrieren, Metasuchen anzubieten, aufzubereiten. Voraussetzungen dafür, ganz klassisches Datenschema, Tarnomdaten, Schnittstellen in Klammern, wir werden dann später sehen, dass das meistens eher oder häufig ein Wunsch ist, tatsächlich als die Realität. Ja, damit komme ich zum
08:01
sächsischen Regionalportal Saxorum, hier ein Blick auf die aktuelle Einstiegsseite des Portals. Konzipiert ist dieses Portal als ein Forum für Sachsen, daher auch der Name, also als ein Treffmittelpunkt für Recherchen, die irgendwas mit sächsische Landesgeschichte, Landeskunde zu tun haben in ihren
08:21
regionalen, nationalen und internationalen Bezügen. Damit einher geht auch dieses Ziel, diese Angebote, die es gibt, weit über die SLUB als Bibliothek oder die SLUB als Bibliothek hinaus, diese Angebote miteinander zu vernetzen und zu verbinden. Das Portal ist mittlerweile seit
08:41
fünf Jahren online. Wichtig ist aber der nächste Punkt, das ist immer noch eine offene Beta-Version, also wir operieren da stark am offenen Herzen mit diesem Portal, zu den Gründen komme ich vielleicht auch gleich machen, Stück. Also das ist ein Angebot, das permanent in Entwicklung ist und kein fertiges Produkt in diesem Sinne darstellt und
09:01
deswegen auch an vielen Stellen merkt man auch den Baustellencharakter, glaube ich, sehr stark noch, wenn man sich diese Seite anschaut. Wir haben hier vier klassische Einstiegspunkte, gibt es in vielen regionalportalen Personen, Orte, Themen und Ressourcen. In den letzten Jahren ist bei vielen Portalen auch das Mitmachen noch so ein Stück
09:20
dazugekommen, wo sozusagen versucht wird, auch die Nutzenden eben mit einzubinden in diese Portale und unser Ziel ist es eigentlich nur in Ausnahmefällen Daten direkt für das Portal zu erheben, sondern das Ziel ist es, Daten, die an anderer Stelle vorliegen, zu aggregieren und sozusagen in das Portal einzubinden.
09:44
Und auch ein weiterer wichtiger Punkt ist die Ablösung von älteren Sonderportalen, die Dislub noch betreibt. Ein paar kurze Beispiele, das ist ein Blick auf eine Treffer in unserer Personensuche, die auf der GND basiert, auf der Erschließungsarbeit, die wir für die Bibliografie mit
10:01
unserer täglichen Arbeit machen und wir dort die sächsischen Personen in der GND gekennzeichnet haben und sozusagen diese Daten regelmäßig aus der GND abgezogen werden und dann hier in das Portal integriert werden. Dann ein Punkt dieser Punkt, Ablösung von Sonderportalen, auf der von Ihnen gesehen linken Seite die historischen
10:20
Adressbücher, die bis letzten Freitag noch eine eigene Präsentation hatten und die jetzt tatsächlich in das Regionalportal integriert werden konnten, also in all das Portal, das wir abschalten konnten und die Daten jetzt hier eben vorhalten. Und auf der anderen Seite die historischen Protokolle des Sächsischen Landtages, das ist auch so ein Work in Progress, an dem wir noch arbeiten, an der Integration. Begleitet wird das
10:43
Ganze auch durch einen Wissenschaftsblock auf Hypothese, also außerhalb des Portals in einer etablierten Struktur für geisteswissenschaftliches Bloggen, um sozusagen dort an die Community dort direkt anschließen zu können.
11:01
Damit komme ich in den letzten Minuten zum vierten Punkt, Daten Integration in und mit Saxon. Die Ziel habe ich gerade so ein Stück benannt, also Aggregation, Integration in das Portal, keine Eigenerhebung von Daten. Das ist ein Gerschnittsthema damit natürlich in der Bibliothek. Also damit sind nicht
11:23
nur ich und meine Kolleginnen und Kollegen im Referat Saxonica und Kartensammlung zuständig. Bei uns liegt inhaltliche Betreuung und wir sind tatsächlich auch die einzige Struktureinheit in der SLUB, die eine dezidierte Stellenwidmung für dieses Portal hat. Wichtig sind
11:41
dann noch die technische Betreuung in der Abteilung Informationstechnologie und eben dieses Team, das Datenbestände bearbeitet und integriert im Referat Datenmanagement. Das sind sozusagen zwei andere Struktureinheiten in anderen Abteilungen, die im Rahmen des agilen Entwicklungsprojekt Managements, das wir an das SLUB
12:00
haben, sozusagen agieren und wo dann immer, wenn dort entsprechende Projekte priorisiert werden, auch Zeit für das Regionalportal ist. Also das ist sozusagen immer wieder eine Herausforderung, das miteinander zu synchronisieren. Die Ansprüche, die wir inhaltlicher Art haben und die Kapazitäten, die technischer seits dann da eingesteckt werden
12:23
sollen. Dabei haben wir uns darauf festgelegt, dass wir eben für Sachsuchen Daten weitgehend automatisiert aggregieren wollen, in einem eigenen Index, also dass keine Live-Abfrage von externen Daten erfolgen soll. Das ist ja immer so dieses klassische Versprechen von Linked-Open-Data
12:41
gewesen, dass man einfach externe die dann aber im Zweifelsfall auch Datenbanken auch mitdurch sucht, nicht mehr online sind, wenn man Pech hat, sodass es hier eben darum geht, Metadaten gemeinsam erst einmal in einen eigenen Index zu bringen und selber vorzuhalten und dann daraus wieder auf externe Angebote zu verweisen. Als Beispiel möchte ich
13:02
auf die Saxorumsuche eingehen. Das ist im Endeffekt, man könnte es als FID für die Sächsische Landesgeschichte oder Landeskunde bezeichnen, nur ohne die finanzielle Ausstattung eines FID. Also auch vielleicht ein bisschen ein zu hohes Ziel, was wir uns da gesetzt haben.
13:22
Hier ist es so, dass wir in einem ersten Schritt unsere eigene sächsische Bibliografie integrieren wollen, dann die sorbische Bibliografie, also eine kleine regional Bibliografie, die in einem aus-universitären Forschungsinstitut in Bautzen betrieben wird und schließlich die Bestandsinformation der im Archivportal D vertretenen sächsischen Archive.
13:41
Damit haben wir am Anfang erst einmal ein relativ überschaubares Set, sozusagen an Daten, die in standardisierten Formaten vorliegen. Das sind die sechs, die Sie hier sehen, mit denen wir sozusagen an dieser Stelle arbeiten. Also das ist noch ein relativ vom Arbeitsaufwand eine relativ überschaubare Angelegenheit.
14:03
Wie funktioniert das? Vom Ablauf her, also nach so einem initialen Abzug der Daten, je nach dem über eine API oder ob, wenn wir uns die Einrichtungen, die hier selbst zur Verfügung stellen, während die auf ein Schema gemapt, ein relativ flaches Schema, das relativ basal ist, eben weil wir
14:21
hier bibliothekarische Daten, Archivdaten und so weiter zusammenbringen wollen und sozusagen, was die Feldbelegungen angeht, da relativ limitiert sind, wenn das wirklich gemeinsam sinnvoll durchsuchbar sein soll. Dann gibt es ein initiales manuelles Processing dieser Daten, dann eine Automatisierung auf Basis
14:41
von XSLT, von Ansible Scripten, von Python Scripten, mit denen das dann immer wieder sozusagen automatisiert durchläuft, so einen Datenabzug, wenn neue Daten vorhanden sind und dazwischen immer wieder schleifen, um zu gucken, wie sieht das aus, kann man damit arbeiten fürs Retrieval.
15:02
Damit einher geht dann aber auch ein kommunikativer Ablauf, natürlich. Also wir, mit jeder der Einrichtungen reden wir, das sind im Archivportal schon eine ganze Menge dann, auch wenn die Daten im Normalfall unter einer Lizenz vorliegen, die eine Nachnutzung ohne Nachfrage erlauben würde. Machen wir das trotzdem einfach, um auch ein besseres Gefühl für
15:22
die Daten selber zu bekommen, weil wir dann nämlich ein Datengeberformular mit diesen Datengebern erstellen, gemeinsam, wo es darum geht, die technischen Voraussetzungen zu klären, was für einer Form liegen die Daten vor, die rechtlichen Voraussetzungen und so weiter, um das dann standardisiert, eben für uns, für jede Datenquelle vorliegend zu haben.
15:45
Was jetzt noch nicht passiert, aber das soll dann sozusagen mitkommen, dass die Einrichtungen selber dann auch gucken können, okay, wie sieht das im Portal aus? Wie kommen unsere eigenen Daten dazu geltung? Ist das okay für uns oder haben wir da irgendwelchen Nachbesserungsbedarf? Und schließlich werden die dann
16:01
die Datensätze in Steckbriefen jeweils vorgestellt, um zu zeigen, okay, da kommen die Daten her. Das sind die Angebote der einzelnen Institutionen. Herausforderung, Heterogenität, wie soll das anders sein?
16:21
Das ist einmal der Datenbezug. Wir haben, GND Beispiel habe ich eben gebracht, einerseits standardisierte Schnittstellen, andererseits Daten, das komme ich gleich nochmal drauf, die eigentlich nicht aufs Teilen angelegt sind, sondern da geht es darum, dass die in der eigenen Datenbank, in dem eigenen Format irgendwie sind und so wie es da ist, ist es schön und niemand von denen, die die Daten anbieten möchte, eigentlich, dass die irgendwo
16:40
anders nach auftauchen. Das ist nun aber wiederum unser Anspruch und das ist tatsächlich dann immer sehr spannend zu schauen, okay, in was für einer Form können wir mit den Daten arbeiten, wenn überhaupt. Genau, diese Quellformate, das ist hauptsächlich bei Mapping dann interessant, um zu gucken, okay, wie können wir was abbilden? Bei einer Datenquelle hat man es jetzt, dass sich im Lauf des Prozesses das Format
17:02
geändert hat, also dass die ihr eigenes Angebot auf ein anderes Datenformat umgestellt haben und wir dann im Ende Weg von vorne angefangen haben, tatsächlich, was das Mapping angeht, also sowas kann auch immer wieder passieren. Genau, und eben dieser Einbezug von Datenbeständen, die nicht aufs Teilen angelegt sind und die im Zweifelsfall ja auch
17:21
in einer Form vorliegen, die wirklich sehr schwer auf bibliothekarische Schematal irgendwie zu übertragen ist. Die drei Bereiche, mit denen wir anfangen wollen, habe ich gerade schon gesagt, dann wollen wir auch mit musealen Objekten weitermachen, über Museum Digital, da gibt es eine schöne Schnittstelle und dann aber so quellenspezifische
17:41
Datenbanken, wo wir eben so sächsische Ausschnitte dann integrieren wollen, wo es mit APs und Datenformaten dann schon ganz anders aussieht, weil die eben aus dem Wissenschaftskontext kommen und sozusagen nicht aus dem Infrastrukturkontext und deswegen formattechnisch da nochmal ein ganz eigenes Thema sein werden. Ja, zum Abschluss
18:03
sozusagen nochmal eine Folie, wie das Ganze aussehen soll. Wer den SLUB-Katalog kennt, wird das erkennen, das ist auch SLUB-feind, also eine Anpassung des Göttinger Typo-3-Feind- Discovery-Systems, also eine Eigenentwicklung auch, die wir dann eben hier für den Saxonum-Kontext anpassen.
18:23
Ja, damit danke ich für Ihre Aufmerksamkeit. Wenn Sie mehr zum Portal wissen wollen, gibt es noch ein paar Literaturhinweise, die folgenden sind ja dann auch online. Ansonsten freue ich mich auf Ihre Fragen. Danke.