We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Open Access Monitoring Östereich- Erfolge meßbar machen

00:00

Formal Metadata

Title
Open Access Monitoring Östereich- Erfolge meßbar machen
Title of Series
Number of Parts
23
Author
License
CC Attribution 4.0 International:
You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor.
Identifiers
Publisher
Release Date
Language

Content Metadata

Subject Area
Genre
Abstract
Welchen Einfluß haben Open Access Abkommen auf die Entwicklung von Open Access in Österreich? Wie stark nutzen Österreichische Wissenschaftler die Zweitpublikationen in Repositories? Diese und ähnliche Fragen lassen sich mit Hilfe eines nationalen Open Access Monitorings beantworten. Im Projekt "Austrian Transition to Open Access (AT2OA"" beschäftigt sich daher eine Arbeitsgruppe mit dem Them, in der sowohl Bibliotheken als auch Forschungsservices vertreten sind. In einem Workshop im April 2018 wurde mit internationalen Experten die Themen Prozesse, Metadaten sowie Open Access Definitionen diskutiert. In dem Projekt wurde die Classification of Open Access Tupples(COAT) entwickelt um das Problem der unterschiedlichen Definitionen der Open Access Farben angehen zu können. Die Möglichkeit entsprechende Daten zu liefern wurde mittels einer Umfrage unter Betreibern universitärer CRISS Systeme erhoben, wie sowohl technische als auch Inhalte Aspekte abdeckte. Mit Hilfe dieser Informationen wurde ein Konzept für ein österreichisches Monitoring zu Open Access entwickelt werden, das sowohl transparent nachvollziehbar und vergleichbare Daten liefert.
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Transcript: German(auto-generated)
Ja, vielen Dank. Ich habe mich ja schon sehr früh bekannt, dass Grün gar nicht so meins ist. Deshalb war ich auch ein bisschen überrascht, in welcher Session ich gelandet bin. Ich spreche allgemein über Open Access Monitoring in Österreich und die Pläne, die wir dazu haben. Das Ganze ist eingebettet in einen Prozess, von dem ja auch schon die Rede war,
die OST Transition to Open Access und das Ganze ist verortet im sogenannten Teilprojekt 1, der Impact Analysis of the Transition und da gibt es eine Unterarbeitsgruppe, die sich mit dem Thema Open Access Monitoring beschäftigt.
Ja, Open Access Monitoring, das heißt, wir wollen etwas messen und für mich war oder für uns war die Kernfrage am Anfang, weil ich jetzt ja in der Green Session bin, was ist eigentlich Green Open Access? Was ist da genau darunter gemeint? Ist das A, Preprint und Postprints oder vielleicht nur die Postprints?
Und das Interessante ist, die einen meinen es so, die anderen meinen es anders. Beide sprechen von Grün. Das heißt, wir haben hier zumindest, wenn man etwas messen und vergleichen will, ein deutliches Problem, denn wir haben einen Term mit unterschiedlich
möglichen Bedeutungen. Gut, jetzt ein kleiner Rückblick auf das letzte Jahr. Dort hat Marco Thulny über Open Access Monitoring gesprochen und hat gesagt, wir brauchen offene Daten, offene Algorithmen und offene Definitionen.
Ja, aber wir haben die Situation, das Ganze gilt natürlich nicht nur für Grün, sondern genauso für Gold und alle möglichen anderen Farben. Die Open Access Farben sind missverständlich. Nun haben wir uns hingesetzt. Was wäre denn dafür eine tolle Lösung, wenn wir das Problem jetzt lösen wollen?
Und wir haben gesagt, ja, eigentlich ist es ganz simpel. Man müsste die Open Access Farben berechnen können. Man möchte irgendein System entwickeln, wenn das geht. Und genau das haben wir entwickelt in dem Projekt. Und das werde ich jetzt vorstellen. Und zwar zunächst haben wir gesagt, wir müssen eigentlich weg von den Farben.
Wir brauchen objektive Kriterien, die wir anlegen. Und dann in einem zweiten Schritt müssen wir oder kann jeder selber seine Farben wieder neu definieren auf Basis dieser Kriterien. Und dann habe ich auch das Problem, dass ich zwei unterschiedliche Gründefinitionen sehr einfach unterscheiden kann.
Also ich werde jetzt diesen ersten Schritt erklären, wie wir von den Farben zu den Kriterien gekommen sind. Und da haben wir uns überlegt, ja, in diesen ganzen verschiedenen Definitionen, die halt so rumschwirren. Was sind denn da wirklich die Unterscheidungsmerkmale? Und ich werde dann gleich noch auf die einzelnen Merkmale ein bisschen eingehen.
Erstmal ist es der der Ort, wo der Open Access stattfindet. Eine ganz wichtige Frage ist immer die Lizenz. Wir haben auch schon gehört, ein Vago-Period ist ein wichtiger Faktor. Welche Version verfügbar ist und unter welchen Bedingungen
ist es denn zu dem Open Access gekommen? So haben wir es erst mal genannt. Und da haben wir dann gesagt, ja, man braucht halt objektive Metadaten. Und daraus kalkulieren wir dann verschiedene Kategorien, die wir dieser einzelnen Merkmale.
Okay, mit dem Ort machen wir das Ganze so. Eigentlich müssten wir einen Link zu den Source haben und Links zu allen Open Access Versionen. Und wenn die Source und die Open Access Version, wenn das einmal ident ist, dann ist es
die Kategorie 1, also ist es in der Source verfügbar. Oder ist es in einem Repository? Da könnte man zum Beispiel die Daten von verschiedenen Repository Verzeichnissen verwenden. Ist es irgendein anderer Ort wie Research Gale?
Auch das ist eine Option. Oder wir wissen es nicht oder es ist einfach nirgendwo verfügbar. Ähnlich mit der Lizenz, da gibt es diesen Lizenz Link und danach können wir dann unterscheiden. Handelt es sich um eine Open Lizenz? Nach der Open Definition ist es eine andere freie Lizenz.
Ist es vielleicht eine properitäre, aber doch dennoch irgendwie offene Lizenz, die sich irgendjemand noch zusätzlich ausgedacht hat? Oder gibt es keine spezielle Lizenz oder wir könnten es im Prozess nicht ermitteln? Okay, und für die Version, da gibt es halt das Driver,
Vocabulary, was wir sagen, wo wir uns dran orientieren können. Und da haben wir halt die Klassiker, die Publisher Version, den Postprint, den Preprint oder wer weiß, oder es ist keine Version frei verfügbar. Auch für das Embargo Date und den Publication Date gibt es Values.
Man könnte es vielleicht auch woanders herbeziehen, wenn es dafür eine sehr schöne Source geben würde. Dazu komme ich später noch. Das ist aber alles ein bisschen gar nicht so einfach. Und da haben wir natürlich die Varianten. Es gibt kein Embargo sechs Monate, zwölf Monate oder mehr sind zwölf Monate oder.
Ja, es gibt gar keine Möglichkeit. Und was machen wir mit den Konditionen? Da haben wir jetzt noch gar nicht so Metadaten Modell gefunden, wo wir es genau hinpacken. Aber das sind halt die. Die Ressource, unter welcher Bedingung macht sie das denn frei verfügbar?
Musste man gar nicht zahlen, was völlig umsonst für den Autoren ist. Es ist paid in einem Full Open Access Medium. Also das umfasst natürlich Open Access Journale, aber vielleicht auch später Bücher. Deshalb oder ist es eine Dessertation? Deshalb haben wir das sehr offen zunächst erst mal formuliert.
Oder ist es bezahlbar in der Open Access Subscription? Man könnte da Daten von DOJ und Open APC zum Beispiel weiterverwenden. Und da haben wir die also klassisch auch free paid paid in Subscription oder eben auch nicht oder anderen.
Gut, gehen wir einen Schritt weiter. Ich habe gesagt, das ist der zweite Schritt, um das berechnen zu können. Wir müssen unsere Farben, unsere eigenen Farben neu definieren. Und da haben wir halt all diese Kategorien. Und ein Beispiel, wer z.B. wie man Gold definieren könnte, wäre so, wie es in der Berlin Declaration abgebildet ist. Also ich brauche da eine offene Lizenz, damit ich all diese Bedingungen erfülle.
Es muss wirklich eine Source verfügbar sein. Die Publisher Version ohne Embargo. Und es kann free paid oder paid also in einem Subscription Medium sein. Also die Berlin Declaration sagt jetzt erst mal nichts gegen Hybrid an sich. Andere Variante, was sehr beliebt ist, dass man sagt Ja,
ich möchte Gold, aber Hybrid zählt nicht. Und aber die Lizenz ist mir zum Beispiel nicht so wichtig. Ich akzeptiere alle Lizenzen und. Die Konditionen sage ich aber nur free und paid. Ansonsten ist das natürlich ident. Und genauso kann ich halt Green da drüber abbilden.
Wie es dann noch genauer dazu kommt, ich komme da gleich noch mal darauf zurück. Wie sieht das jetzt in Österreich aus? Wie sieht unser Workflow aus, den wir derzeit so ein bisschen am Plan sind? Wir haben uns da für so ein Button-up-Workflow entschieden. Der ist noch nicht implementiert, muss ich sagen. Das ist noch so ein bisschen in der konzeptionellen Phase.
Aber die Idee ist, dass praktisch verschiedene Institutionen aus den Publikationsdatenbanken, die sie haben, aus dem Courage Research Information System, ihre Daten zu liefern. Warum haben wir uns dafür entschieden und nicht? Wir suchen uns einfach die Daten auf Scopus und Web of Science zusammen. Das war, weil dann sind die Institutionen
dafür verantwortlich, dass ihre Daten vollständig sind. Und sie können sich nicht hinterher beschweren. Ja, da fehlt ja was. Der und den Aspekt, den habt ihr völlig vergessen. Und dann sind sie dafür verantwortlich, dass es vollständig geliefert wird. Sie können natürlich auch nur Scopus und Web of Science Daten liefern. Also das steht dann auch der Institution frei.
Also dann haben wir gedacht, wir müssen trotzdem über die Daten eine gewisse Normalisierungslayer später drauf legen und die duplizieren, aber gleichzeitig zusammenführen, aber gleichzeitig die Source erhalten. Also wenn es von mehreren Einrichtungen gemeldet wird, muss das natürlich dann auch sich abbilden.
Dann wollen wir die gelieferten Daten anreichern mit den bekannten Quellen Crossref, Unpaywall und so weiter. Aber natürlich nicht von Unpaywall die Farben, sondern basierende Daten. Auch da kommen wir schon ein bisschen weiter. Und dann zum Schluss wollen wir das nach den Farben auswerten.
Nun, das war bisher ein ganz interessantes Modell. Und ich habe mir gesagt, ich habe es letztens ein bisschen gelernt, habe gesagt, okay, funktioniert denn das Ganze? Hab mal so ein Proof of Concept entwickelt. Und da haben wir halt ein Workflow.
Und ich habe gesagt, für einen Testfall, ich starte mal mit dem theoretischen Modell, ich kriege nur die DUI. Mehr will ich erst mal gar nicht. Und dann reiche ich die DUI mit den Daten von Crossref an. Nimm vielleicht noch mal zusätzlich die DUI-J Daten wegen der Lizenz und ein paar andere Geschichten.
Die Unpaywall-Daten füge hinzu die OpenAPC-Daten und OpenAir-Daten. Also es gibt natürlich noch weitere Ressourcen. Das ist mir bewusst, aber aus Ressourcen und Zeitgründen ist es jetzt erst mal bei denen geblieben. Und da kann ich mir schon Informationen zu den verschiedenen
Optionen, die ich gerade gesagt habe, kann mir das schon mal zusammensuchen, in welcher Klassifikation denn eine Publikation einzuordnen ist und kann dann für eine einzelne Publikation den, wie wir es genannt haben, die Klassifikation
auf Open Access Tupel berechnen. Also kann sagen, wo liegt sie in den einzelnen Klassen und kann dann sagen, das ist eine 12211 Publikation. Also das sind dann die entsprechenden Kriterien. Und darüber mache ich das für alle Publikationen und lege dann
darüber meine Open Access Definitionen mit den entsprechenden Labels, wie ich sie definiert habe, und kann dann praktisch gucken, in welche Schublade passt jetzt welche Publikation und kann dadurch dann wirklich eine Farbe als ein berechnetes Ergebnis liefern. Nun, dieser Proof of Content ist implementiert in R,
aber derzeit nur für einzelne DOIs, nicht als Funktionen, um das Ganze über größere Mengen bisher laufen zu lassen. Wie gesagt, ich habe erst vor kurzem gelernt und mir fiel da auch ein bisschen die Zeit dafür, aber wenn der Leute interessiert sind und sich beteiligen wollen,
deswegen habe ich es einfach schon mal bereitgestellt, damit man sich das einfach auch schon mal angucken kann. Es ist also über GitHub schon verfügbar. Es ist natürlich nicht, das muss man auch noch mal betonen, wie alle Monitoring-Ansätze, es ist nicht 100 Prozent korrekt, weil natürlich die verschiedenen Sourcen auch nicht 100 Prozent die Daten liefern.
Was sind jetzt unsere nächsten Schritte? So ein bisschen aufgrund dieser ersten Erfahrungen weiter zu überlegen. In Österreich, welche Daten brauchen wir denn noch zusätzlich? Also praktisch ein Metadaten Modell zu bestimmen, die die einzelnen Institutionen liefern können, damit wir das ganze System vielleicht noch stärker verbessern können.
Und diesen Proof of Concept eher nicht nur als Proof of Concept zu lassen und daraus wirklich eine Funktion zu entwickeln, wo man dann wirklich größere Datenmengen analysieren kann. Gleichzeitig haben wir in Österreich eine AG der Universitäten,
wo die Repräsentanten Betreiber der CRIS-Systeme sind. Und mit denen wollen wir natürlich schauen, welche Daten können sie überhaupt liefern, um praktisch dieses Metadaten Modell mit ihnen zusammen zu durchdenken und dann ein gemeinsames Metadaten Modell zu entwickeln.
Warum das Ganze noch mal gesagt? Wir denken also, für ein Open Access Monitoring sollte das Gleiche gelten, was wir sagen, es soll in Open Science gelten. Das heißt, es muss transparent, nachvollziehbar sein. Es muss ein Dritter, muss es überprüfen können.
Und genau deswegen sagen wir, das ist die Richtung, in die Richtung, die wir gehen wollen. Und ich lade Sie dazu ein, lassen Sie uns an einem einheitlichen Monitorungssystem arbeiten, dass jeden trotzdem seine eigenen Culeurs lässt. Besten Dank und Fragen jetzt gerne.