Persistent Identifier in Open-Access-Publikationsworkflows
This is a modal window.
The media could not be loaded, either because the server or network failed or because the format is not supported.
Formal Metadata
Title |
| |
Title of Series | ||
Number of Parts | 32 | |
Author | 0000-0001-7080-634X (ORCID) 0000-0003-3334-2771 (ORCID) 0000-0002-0458-1004 (ORCID) | |
License | CC Attribution 3.0 Germany: You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor. | |
Identifiers | 10.5446/59512 (DOI) | |
Publisher | ||
Release Date | ||
Language |
Content Metadata
Subject Area | |
Genre |
Open-Access-Tage 202224 / 32
00:00
Computer animation
22:16
Engineering drawing
Transcript: German(auto-generated)
00:05
Ja, vielen Dank für die Einladung und für die herzliche Begrüßung. Eigentlich schließt sich der Vortrag jetzt thematisch sehr gut an den Vortrag von Paul, weil was wirklich Hand in Hand gehen muss, sind Metadaten und persistent identifier.
00:20
Die wurden jetzt schon immer angesprochen. Wir geben jetzt noch mal ein bisschen die Basics, vor allem in meinem Part, und wir werden auch noch mal ganz konkret erläutern, wo man denn PRDs in Open Access Publikations Workflows anwenden kann. Genau, wie gesagt, kurz zu den Basics.
00:41
PRDs, Stiefel persistent identifier, sind eindeutige, universelle und dauerhafte Identifier für digital online zugängliche Objekte. Und sie können in URLs umgewandelt werden, die eben zur zu identifizierenden Quelle oder zu einer Landing Page mit Metadaten führt. Und PRDs sind in der Regel institutionell verwaltet.
01:04
Wie auch Paul gesagt hat, es braucht immer jemanden, der auch die Persistenz sichert und die Magie entsteht wirklich erst durch offene Infrastrukturen, die eben APIs zum Abrufen der Metadaten bereitstellen und die PRDs eben auflöst.
01:25
Genau, hier noch mal eine Auswahl. Wahrscheinlich einen Bekannten wurde jetzt auch schon angesprochen. Nur noch mal auch der Hinweis, DOIs können also nicht nur für Textpublikationen genutzt werden, sondern mittlerweile eben auch für wissenschaftliche Konferenzen, für wissenschaftliche Instrumente, Großgeräte.
01:43
Wir haben auch noch darüber hinaus weitere PRDs wie IGSN für geologische Proben, beziehungsweise für Proben aller Art. PRDs für Personen, da werden wir auch noch mal genauer darauf eingehen. Gerade in Deutschland ist eben neben Orkut auch die gemeinsame Normdatei vertreten.
02:00
Das ist ein Dienst der Deutschen Nationalbibliothek zur Erschließung von Publikationen und Repräsentationen von Körperschaften. Und auch schon angedeutet ebenso die ID der Research Organization Registry Raw, die eben zu eindeutigen Beschreibungen von Organisationen tätig ist. Dabei ist das hier also wirklich nur eine Auswahl.
02:21
Es gibt wirklich allerhand PRDs. Damit schon zum ersten Use Case. Wie kann ich PRDs in Open Access Publikationsworkflows anwenden? Und als erstes möchte ich vorstellen, wie man PRDs in sogenannten Affiliations- und Publikationsrichtlinien verwenden kann. Also Richtlinien, die institutionell vorgehen, wie die Institutionszugehörigkeit
02:45
und weitere Angaben zur eigenen Person beim Publikieren bzw. im Forschungskontext jeglicher Art anzugeben sind. Und warum ist das interessant für die Einrichtungen? Es geht hier vor allem um die einheitliche Darstellung,
03:01
um eben auch den Forschungsoutput der institutionszugehörigen Person vollständig und konkret abbilden zu können. Und dies ist eben nicht nur für die Erschließung der Publikation wichtig. Sondern eben auch für die spätere Leistungsmessung auf Forschenebene bzw.
03:21
Berichtserstellung auf Instituts- und Fördergebene. Um dies wirklich zu gewährleisten, sollten natürlich mehrere Identifier benutzt werden. Also neben DOI eben auch eine Orgut-ID, damit z.B. die Forschenden eindeutig verknüpft sind. Oder eben die RAW-ID, damit die Institutionen eindeutig
03:43
unterschieden werden können von anderen Einrichtungen. Beispiele finden sich z.B. bei der Theo Berlin oder auch in der Richtlinie zur Benennung der Theo Braunschweig. Genauso wie die Richtlinie für die standardisierte Angabe der Affiliation
04:02
in wissenschaftlichen Publikation der Affiliationsrichtlinie von der HU Berlin. Damit schon zum zweiten Use-Case, auf den ich näher eingehen möchte. Und zwar speziell von der Verwendung der Orgut-ID für Verlage. Also sowohl für kommerzielle Open Access-Verlage als auch für institutionelle Verlage.
04:25
Während Orgut standard bereits bei Verlagen wie PLOS, E-Life, Frontiers, Wiley und Springer Nature ist und diese eben die Orgut-ID verpflichtend bei ihren Autoren abfragen, ist es noch dabei bei vielen kleineren und mittelständischen sowie Hochschulverlagen
04:42
diese in den Publikationsworkflow einzubringen und diesen Standard umzusetzen. Aber dies ist gerade sinnvoll, wenn wir von Open Science sprechen und wissenschaftsgeleiteten publizieren. Ja, was können also Verlage tun, um ihren Autorinnen Orgut zu ermöglichen?
05:02
Aus unserer Sicht gibt es hier drei Möglichkeiten. Einerseits gibt es die Möglichkeit, die Orgut-API in die eigenen Systeme zu integrieren. Wie vielen von Ihnen sicherlich bekannt ist, bietet Orgut dafür eine kostenlose öffentliche Public-API an,
05:21
sowie eine kostenpflichtige Member-API, die sich in eine Vielzahl von Systemen implementieren lassen kann. Dies erleichtert es den Verlagen, die Forschenden bei der Einreichung ihrer Publikation eindeutig voneinander zu unterscheiden. Und Power hat auch schon ein sehr schönes Beispiel gemacht.
05:40
Andererseits kann das eben auch den Aufwand für die Autorinnen erleichtern, weil vielleicht schon mal das Autorinnenkonto automatisch mit den eigenen Angaben aus dem Orgut-Record befüllt werden kann. Ja, im Fall von institutionellen Verlagen empfehlen wir auf jeden Fall, prüfen Sie, ob Ihre Universität, Ihre Universitätsbibliothek vielleicht bereits Mitglied bei Orgut ist
06:05
und beispielsweise Orgut schon um ein eigenes Repositorium implementiert hat. Hier lässt sich dann prüfen, ob man einen Austausch zwischen den Systemen, zwischen Univerlag und Repositorium ermöglichen kann. Besonders einfach lässt sich Orgut und auch Raw zum Beispiel bei einem Plugin auch in OGS anbinden.
06:25
In OMP ist es leider noch nicht möglich, soweit ich weiß. Andererseits gibt es auch die Möglichkeit, gerade für institutionelle Verlage auch ohne API Orgut zu nutzen, vor allem um die eigenen Prozesse effizient zu gestalten.
06:42
Wie geht das Ganze? Wir empfehlen hier den Betreiberinnen frühzeitig, die Orgut-ID von den eigenen Autorinnen in Erfahrung zu bringen bzw. sie über die Orgut-ID aufzuklären und von der Registrierung zu überzeugen. Das kann beispielsweise durch ein Feld auf der Verlagswebsite erfolgen
07:01
oder über die Bereitstellung von Autorinnen-Checklisten als PDF-Formular. Und somit können eben die Informationen aus den Orgut-Profilen bereits bei der Begutachtung verwendet werden, um zum Beispiel auch Interessenskonflikte frühzeitig aufzudecken. Zur letzten Möglichkeit noch schnell, und das ist glaube ich auch schon sehr deutlich geworden,
07:25
überall wo es geht, empfehlen wir PRDs, sei es die Orgut, sei es DOE, sei es RAW, in Metadaten einzutragen. Wir haben es gerade gehört, das ist möglich bei Datasite, bei Crossref genauso, eben über verschiedene Upload-Funktionen oder die API.
07:43
Was ist daran so toll? Das wurde glaube ich oder ist auch schon ein bisschen hervorgegangen. Wenn die PRDs in den Metadaten eingetragen ist bei Datasite oder Crossref, dann ist das Werk eben nicht nur im Orgut-Record abgebildet, sondern findet sich dann in allen Datenbanken die Datasite und Crossref-Metadaten beziehen.
08:04
Und somit haben wir halt immer die Verknüpfung zwischen Werk und Autor hergestellt, was natürlich auch für die Sichtbarkeit ganz wichtig ist. Der Eintrag von Orgut-IDs in die Metadaten ist auch relevant für die Pflichtablieferung bei der DNB, beispielsweise bei Dissertationen.
08:21
Und hier ist es so, wenn die Orgut-ID mit dem Titelmetadatensatz übermittelt wird, wird mittels Abgleichverfahren geprüft, ob die Namensform in einem vorhandenen GND-Personen-Datensatz übereinstimmt. Und wenn dies der Fall ist, dann wird die Verknüpfung der Datensätze ausgelöst.
08:40
Und zu allerletzt auch noch ist zwar simpel, aber die Empfehlung, einfach die PIDs in das Werk selbst aufzunehmen, damit sie eben nie verloren gehen. Also sei es beispielsweise im Impressum oder in die Autorenliste bei Sammelbänden oder eben auch, wenn medieneutral publiziert wird, in die XML-Dateien.
09:01
Genau, und nur noch ganz kurz ein Verweis auf unseren Orgut.de-Monitor, wo man sehr viele Statistiken und Zahlen zur Verbreitung von Orgut findet, eben auch zum Beispiel die Anzahl von Orgut-IDs in Crossref-Metadaten. Und nun darf ich übergeben an Jochen, der noch weitere Beispiele nennen wird.
09:24
Genau, ich möchte im Prinzip den Kontext der Publikations-Workplus etwas erweitern, noch mal Bezug nehmen auf den Orgut.de-Monitor, der im Prinzip wesentlich noch den Quellen von BASE, der Deutschen Nationalbibliothek, und Orgut selbst beruht.
09:44
Und Antonia hat es ja bereits gesagt, dass es eben sehr vielfältige Auswertungsmöglichkeiten gibt, das Vorkommen von Orgut in Dokumenten, in Repositorien, in Crossref, in Netzpublikationen der Deutschen Nationalbibliothek, aber auch, dass man hier einsehen kann die Zahl von, oder die Nutzung von
10:04
Claiming-Diensten, sei es der von BASE oder auch der von DNB. Hier möchte ich einmal darstellen, wie von der quantitativen Zahl her persistenter Identifier in Infrastrukturen wie BASE und Open Air vorkommen.
10:26
Beide Infrastrukturen zu vergleichen ist vielleicht ein bisschen waghalsig. In BASE haben wir halt die Situation von über 312 Millionen Dokumenten, die allerdings nicht dedupliziert sind. Im Vergleich dazu eben Open Air mit deduplizierten Dokumenten etwas mehr als die Hälfte davon.
10:43
Man erkennt sehr deutlich den sehr großen Anteil von DOIs, wobei hier nicht genauer spezifiziert ist, ob sie von Crossref, von Datasite oder anderen Agencies kommen und auch nicht genauer spezifiziert ist, ob sie sich auf das Dokument selbst fokussieren oder vielleicht auch
11:06
beispielsweise Förderorganisationen oder andere Dinge referenzieren. Auch interessant, hier ist zu sehen der Anteil von Angaben, der Anteil der Orchid-IDs in Dokumenten. Der Unterschied zwischen 6,6 Millionen
11:27
Dokumenten in BASE zu über 21 Millionen in Open Air erklärt sich im Prinzip dadurch, dass Open Air proaktiv auch das Orchid Public Data File, was eben jedes Jahr herausgegeben wird, mit den Open Air Research Graphen
11:43
abgleicht und entsprechend anreichert. Ein weiterer Anwendungskontext PIDs, zum Beispiel von BASE, ist der schon erwähnte Claiming Service. Das heißt, ich kann mir einen Account in BASE zulegen und dann meinen BASE-Account
12:06
mit meiner Orchid-ID verknüpfen, kann nach meinem Namen in BASE suchen und Dokumente, die eben noch nicht mit meinem Orchid-Profil verbunden sind, entsprechend verknüpfen. Und entsprechend habe ich verschiedene Optionen,
12:24
dass ich sagen kann, dass mein Orchid-ID soll mit dem Dokument in BASE verbunden werden und auch in die Orchid Registry entsprechend exportiert werden oder eben nur in BASE dargestellt werden. Was man an dem Diagramm sehen kann,
12:42
ist im Prinzip die Nutzung des Claiming Service in BASE, der seit Ende 2017 aktiv ist und mittlerweile über 30.000 Nutzern über 350.000 Dokumente geclaimed haben. Was natürlich noch lange nicht an Zahlen wie von Elsevier oder
13:05
Cross-Preferanten kommt, die eben die quantitativ größten Zahlen von Dokumenten in Orchid verknüpfen. Ein anderes Beispiel bezieht sich darauf, wie mit persistenten Identifiyern in Open Air Explorer umgegangen wird.
13:24
Hier ist ein Beispiel einer Publikation, die verschiedene Versionen darstellt, einerseits ein Preprint aus Archive. Man sieht auch, dass es zu diesem
13:43
Preprint eine Verlagspublikation in Applied Economics gibt, dass die Publikation auch an anderen Datenbanken wie an Paywall registriert wurde. Und da die drei Autoren aus Bielefeld kommen, auch ein Nachweis in unserem
14:02
Repositorium vorhanden ist. Entsprechend sind eben zwei DOIs angegeben, die entweder auf das Archive Preprint verweisen oder auf die Verlagsversion. Und was des Weiteren noch auffällt, ist, dass es zu allen drei Autoren eine Orchid-ID gibt, allerdings einmal in grün, wie es eben auch dem Orchid-Richtlinien
14:25
entsprechend dargestellt ist, und einmal in schwarz, was den Hintergrund hat, dass die grün hinterlegte Orchid-ID tatsächlich eben auch mit dem Public-Data-File von Orchid abgeglichen wurde und bei der schwarz hinterlegten noch nicht passiert ist.
14:42
Das heißt, die Information wurde entweder durch entsprechende Algorithmen von Open Air identifiziert oder kommt eben aus Drittquellen. Zu der Problematik der Metadatenvollständigkeit macht sich Open Air den Fakt zu Nutze,
15:02
dass eben eine Publikation in verschiedenen Quellen hinterlegt ist, entsprechend aggregiert wird, und das Ergebnis eben ist, dass die Metadaten in den Quellen unterschiedlich vollständig sind. Entsprechend bietet Open Air hier einen Dienst an zur Anreicherung eventuell fehlender Informationen für
15:25
Repository-Manager und hier ist einmal eben eingekreist die Möglichkeit, dass man Persistent Identifier, die eben aus anderen Quellen gezogen worden sind, ergänzen kann oder eben auch Orchid-IDs. Ebenso eine sehr wichtige Rolle spielen
15:43
Persistent Identifier in der ganzen Verarbeitungspipeline von Metadaten in Open Air. Wie gesagt, das Harvesting aus sehr vielen heterogenen Quellen, Integration von Citationsdaten, Banken und Normdaten, wo natürlich
16:03
Persistent Identifier eine sehr große Rolle spielen, wodurch eben auch bereits weitere Services entstanden sind, beispielsweise der Skoll Explorer Service, wo eben Forschungsliteratur auf Basis der DOI und Relationsinformationen
16:20
mit Forschungsdaten verknüpft werden. In dieser ganzen Phase der Deduplizierung, der Bereinigung und statistischen Analysen ergeben sich eben dann die Möglichkeiten, dass diese Informationen beispielsweise im Open Science Observatory nachgenutzt werden können oder eben auch an Repositorien über den
16:43
Anreichungsservice zurückgespielt werden. Gehe ich mal wieder eine Ebene runter auf die Ebene von Repositorien und Forschungsinformationssystemen. Habe ich hier einmal dargestellt, wie sich die Rolle von PIDs auf
17:00
verschiedenen Ebenen darstellt, also auf der Ebene des Services, der lokalen Ebene, beginnend mit der Authentifizierung, in der ich die Orchid ID beispielsweise sinnvoll einsetzen kann, aber auch die verschiedenen Aspekte, die das Publikationsmanagement ausmachen, dass ich also anhand der DOIs mir die
17:21
Metadaten aus anderen Datenbanken ziehen kann oder eben direkt aus Crossref oder Datasite große Metadatenmengen zu meiner Institution importieren kann. Des Weiteren die Nutzung der DOI, aber eben auch Orchidangaben
17:41
in Ergänzung natürlich zu Titelangaben und so weiter für die Duplizierung und eben auch die Problematik, die eben schon heute mehrfach erwähnt wurde, der Verknüpfung, der Verlinkung mit anderen Entitäten, also von Publikation zu Publikation oder zu Projekten oder zu Forschungsdaten.
18:01
Auf der globalen Ebene natürlich, je intensiver und vollständiger PIDs in Metadaten angegeben sind, unterstützt es die Dissemination und damit auch die Sichtbarkeit und damit eben auch die Indexierung in entsprechenden Suchmaschinen oder Wissensklappen. Die dritte Ebene ist im Prinzip die
18:24
Grundlage dafür, dass entsprechende Richtlinien und Standards geschaffen worden sind. Natürlich möchte ich hier auch das DINI-Zertifikat erwähnen, in dem die Nutzung von Dokument PIDs dringend empfohlen wird, aber eben auch
18:41
ein desiderat des Orchid.de-Projekts, das heißt wie kann ich die Orchid ID in meinen eigenen Metadaten im Repository einbetten. Ähnliche Verfahrensweisen in verschiedenen Varianten der Open-Air-Guidelines und worauf ich gleich noch eingehen möchte, auf die Aussagen des COA-Frameworks bzw. Plan S. Hier ist vielleicht die Vorgeschichte, die,
19:10
dass quasi der erste Entwurf von Plan S vorlag von der Coalition S, COA darauf reagiert hatte und gefordert hatte, dass eben auch die
19:20
Anforderungen und Möglichkeiten von Open Access-Repositorien in Bezug auf PIDs, erkennt man eben eine gewisse Deckungsgleichheit zwischen diesen beiden Dokumenten, dass eben essentiell ist, dass PIDs in den Metadaten angegeben werden, die auf die Landing-Page der Ressource verweisen und dass es aber eben auch sehr wünschenswert ist, wenn
19:43
entsprechende Verlinkungen in den Metadaten-Records mit anderen Inhalten und Entitäten angegeben werden. Schließlich und endlich gibt es verschiedene Initiativen, Arbeitsgruppen und Strategien,
20:02
sowohl auf nationaler wie internationaler Ebene. In Deutschland bilden sich Konsortien im Rahmen der nationalen Forschungsdateninfrastruktur, die sich eben nicht nur mit dem Aufbau und der Vernetzung von Datenservices beschäftigen, sondern eben auch Querschnittsthemen wie die Nutzung von PIDs im Rahmen der Forschungsdaten annehmen.
20:29
Das Problem von stabilen, vertrauenswürdigen Infrastrukturen für PIDs wird aber ebenso eben auch auf der Ebene von Forschungsförderen aufgegriffen, wie in einer Arbeitsgruppe von
20:42
Knowledge Exchange, wo eben im nächsten Monat im Prinzip ein Standsaufnahme gemacht, wie ist der Stand der Nutzung, Entwicklung von PIDs in den verschiedenen KI-Mitgliedsländern. Und ein
21:03
weiteres Beispiel ist eine Arbeitsgruppe in ADA, die eben in diesem Fall nicht diesen Technikfokus hat, sondern sich darauf konzentriert, in welcher Form gibt es im Prinzip nationale Strategien für PIDs und Infrastrukturen und hier eine Art
21:23
Austauschforum geschaffen wird, weil eben PIDs und die Infrastruktur dafür eben nicht die Aufgabe einer einzelnen Institution und auch nicht die Aufgabe eines einzelnen Landes sein kann, sondern das auf internationale Ebene koordiniert und standardisiert werden muss. Und ähnlich verhält es sich eben auch mit der EOSC, wo es zum einen als
21:45
Ausgangsdokument einer PID-Policy gibt, in der die verschiedenen Begrifflichkeiten nochmal definiert werden hinsichtlich von verschiedenen Rollen und Verantwortlichkeiten
22:00
für PIDs und darauf aufbauend es gegenwärtig eine Taskforce gibt, die sich mit der Implementierung dieser PID-Policy in der EOSC auseinandersetzt. Abschließend, was ist eigentlich unsere Vision? Ganz lapidar gesagt, dass es eben
22:25
für alle relevanten physischen wie eben auch digitalen Entitäten persistente Identifier gibt, sodass ich eben diese verschiedenen Ressourcen im Forschungsalltag vernünftig dauerhaft adressieren kann, mit Metadaten
22:41
beschreiben kann und im Prinzip man dann durch diesen Forschungsworkflow auch gut navigieren kann. Genau, und ich glaube, weil wir jetzt schon etwas über die Zeit sind, lasse ich die Folie einfach so stehen.
23:00
Wir stehen hier nämlich als Vertreterin des Orca.de-Projekts und hier stehen noch ein paar Punkte dazu und eben nicht alleine, sondern hier unten sehen Sie auch nochmal unsere Projektpartnerin. Ja, damit vielen Dank für die Aufmerksamkeit und jetzt stehen wir für Fragen bereit.
Recommendations
Series of 6 media