We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

DeepGreen-Duplikatfilter

Formal Metadata

Title
DeepGreen-Duplikatfilter
Title of Series
Number of Parts
8
Author
Contributors
License
CC Attribution 3.0 Germany:
You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor.
Identifiers
Publisher
Release Date
Language
Production Year2025
Production PlaceBamberg

Content Metadata

Subject Area
Genre
Abstract
Problem: Mehrmals das gleiche Artikel bekommen (meistens wenn ein Verlag die Metadaten ändert, die Artikeln werden als 'Neu' erkannt und noch mal von DeepGreen zu DSpace gesendet). Unsere Lösung basiert auf dem DOI im Metadatenfeld 'dc_identifier_doi' bei SwordV2 und DSpace V7.4. Ansonsten müssen Sie dies an Ihr eigenes Metadatenfeld anpassen, in dem der DOI gespeichert ist. (z.B. local.identifier.doi). Dies ist nicht die einzige, beste oder effizienteste Lösung, die Sie finden können. Die Lösung kann verbessert werden (z. B. DOI und Fuzzy-Suchalgorithmus vergleichen, um andere Metadaten zu prüfen, bevor wir die Entscheidung treffen, wie Titel, Verlag, Veröffentlichungsdatum, URN oder andere eindeutige Identifikatoren) Implementation: Wir haben eine neue Funktion 'countDOIMatches()' in der DAO-Schicht von MetadataValue hinzugefügt. Die Methode zählt die Elemente (mit Ausnahme des aktuellen Elements), die dieselbe DOI haben wie das zu prüfende Element. Nur wenn die DOI des aktuellen Elements nicht null ist, wird die DOI geprüft. Auch die teilweise Übereinstimmung wird geprüft: z. B. DOI mit/ohne „http://doi.org“ oder „https://doi.org“. Wird die Übereinstimmung gefunden, wird das Element übersprungen. DeepGreen erhält die Rückmeldung über Swordv2: CREATED (normaler Arbeitsablauf - so dass DeepGreen das nächste Dokument senden kann). Das „Ergebnis“ enthält jedoch die Information, dass das Dokument bereits importiert wurde und ein Duplikat ist. (im WorkflowManager::resolveState)
Keywords