Automatisierungsmöglichkeiten der Software OpenRefine

Zitieren

Zugehöriges Material

Verein Deutscher Bibliothekarinnen und Bibliothekare e. V. (VDB)

Berufsverband Information Bibliothek e. V. (BIB)

Lohmeier, Felix

Formale Metadaten

Titel

Automatisierungsmöglichkeiten der Software OpenRefine

Serientitel

109. Deutscher Bibliothekartag, 14. - 18.06.2021 Bremen

Anzahl der Teile

Autor

Lohmeier, Felix

Lizenz

CC-Namensnennung 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.

Identifikatoren

10.5446/56060 (DOI)

Herausgeber

Verein Deutscher Bibliothekarinnen und Bibliothekare e. V. (VDB)

Berufsverband Information Bibliothek e. V. (BIB)

Erscheinungsjahr

2021

Sprache

Deutsch

Inhaltliche Metadaten

Fachgebiet

Information und Dokumentation

Genre

Konferenz/Talk

Abstract

Die Open-Source-Software OpenRefine ist bekannt für ihre grafische Oberfläche, die einem Tabellenverarbeitungsprogramm ähnelt. Sie wird oft als Desktop-Software installiert und zur Analyse, Bereinigung und Anreicherung von Metadaten eingesetzt. Laut Nutzerstudie von 2020 [1] sind Bibliothekar*innen mit rund 38% die größte Nutzergruppe. Weniger bekannt sind die Automatisierungsmöglichkeiten von OpenRefine. Durch die Client-Server-Architektur lässt sich OpenRefine auch auf einem Webserver installieren und über die Kommandozeile steuern. Das hat den Charme, dass Transformationsregeln in der Oberfläche spielerisch erprobt werden können und dann beispielsweise täglich automatisiert auf neue Datenlieferungen angewendet werden können. Die Automatisierungsmöglichkeiten werden am Beispiel der Open-Source-Software openrefine-client [2] demonstriert. Der Hauptbestandteil des Vortrags ist eine Live-Präsentation, die bei Interesse auch zeitgleich selbst nachvollzogen werden kann. Dafür werden über openrefineder [3] On-Demand-Server mit Jupyter Notebooks bereitgestellt, die ohne Installation im Browser aufgerufen werden können.