Wikidata-Normdatenverknüpfung mit Cocoda
This is a modal window.
The media could not be loaded, either because the server or network failed or because the format is not supported.
Formal Metadata
Title |
| |
Title of Series | ||
Number of Parts | 36 | |
Author | ||
License | CC Attribution 3.0 Unported: You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor. | |
Identifiers | 10.5446/51060 (DOI) | |
Publisher | ||
Release Date | ||
Language |
Content Metadata
Subject Area | |
Genre |
5
11
13
14
15
16
18
19
31
32
36
00:00
Interior (topology)Witt algebraCOCO <Programm>Texture mappingComputer scienceToken ringInternetComputer animation
01:35
Function (mathematics)Texture mappingKnowledge organizationWikiMeeting/Interview
01:59
CountingERNA <Programm>DemosceneHTMLSpoke-hub distribution paradigmSource codeGNU <Software>User interfaceNeWSVDMNFSInstanz <Informatik>InformationFunction (mathematics)Texture mappingWeb applicationState of matterPasswordLoginComputer fileMusical ensembleWikiInequality (mathematics)Ankh <Computerspiel>Web-AnwendungHome pageEditorService PackComputer animation
05:22
NFSUniform resource nameEditorINGA <Programm>CarriagewayMenu (computing)World Wide WebLink (knot theory)Uniformer RaumTexture mappingPattern languageApache WicketMISSLevel (video gaming)Route of administrationEnde <Graphentheorie>HANS <Datenbanksystem>Abstract syntax treeWikiDigital signalHierarchyEditorMach's principleComputer animation
13:20
SummationUser interfaceWorld Wide WebAPICode division multiple accessTrigonometric functionsData centerGNU <Software>ICONCellular automatonEckeMilan <Programmiersprache>Normal (geometry)DatabaseIP addressQuery languageHome pageDynamic random-access memoryFunction (mathematics)Library catalogSound <Multimedia>Ende <Graphentheorie>EstimationMusical ensembleInterface (computing)Systems <München>Link (knot theory)Open sourceTexture mappingTime zoneRoute of administrationBindung <Stochastik>TouchscreenInversion <Mathematik>StatistikerInformation retrievalSoftwareTwitterComputer animation
21:06
Data centerXMLComputer animationMeeting/Interview
Transcript: German(auto-generated)
00:00
Und jetzt wechseln wir auf den zweiten Teil, auf Deutsch, und ich hoffe, dass ihr auch noch in den zweiten Teil teilnehmt. Ja, ich werde das sagen.
00:31
Genau, ich glaube, wir gehen jetzt einfach direkt, würde ich sagen, Jakob, muss man nicken, ja, in den zweiten Teil. Genau, Jakob wurde ja schon erwähnt, der Co-Host, der leider etwas
00:44
später kommen musste, aber dann jetzt wieder offenbar stabiles Internet hat, wunderbar. Und da wurde ja auch schon in dem Talk gerade erwähnt, als jemand, der indirekt dann auch Andrea oder direkt Andrea begegnet ist und ein Projekt von ihr auch mitgeprägt hat.
01:03
Das ist ja wunderbar, das zu hören, denke ich mal. Jakob arbeitet bei der Verbundzentrale des gemeinsamen Bibliotheksverbundes VZG in Göttingen und ist dafür die Forschung und die Entwicklung zuständig. Und er hat in Berlin und Chemnitz Bibliothekswissenschaften und Informatik studiert.
01:21
Genau, und erzählt uns jetzt was über das Mapping von Normdaten mit Kokoda. Ja, Dankeschön für die Einführung. Und auch nochmal Danke an Andrea für den sehr interessanten Vortrag. Ja, also ich beschäftige mich schon sehr lange mit Wissensorganisationen in dem Bereich.
01:41
Und das Projekt die letzten Jahre, wo ich am meisten mitgemacht habe, ist das Projekt HooliKong. Und das Tool, was daraus entstanden ist, ist Kokoda zum Mapping von Normdaten. Und dort haben wir halt auch Funktionen für Wikidata eingebaut. Und darauf wollte ich mich jetzt konzentrieren, die vorzustellen.
02:03
Also ich habe jetzt im Vorfeld muss ich auch nochmal meinem Kollegen Stefan danken, der noch schnell mal ein paar Bugfixes eine Stunde vorher eingespielt hat. Und ich habe noch schnell eine Hilfeseite angelegt in Wikidata selber, die speziell auf die Wikidata Funktion von Kokoda eingeht.
02:21
Also da ist es hier auf Englisch beschrieben. Aber wir machen erst mal auf Deutsch die Erklärung. Also ich starte mal, wir können auch von der Projekt Homepage starten, die Homepage von HooliKong und über das Tool, über Kokoda selber, die Web-Anwendung.
02:43
Und da haben wir halt einmal unsere Standardversion, wo alle Funktionen drin sind. Und dann haben wir noch eine Funktion, eine Instanz, die ein bisschen abgespeckt ist, wo verwirrende Features, sage ich mal, abgeschaltet sind. Die speziell für Wikidata gut ist. Also die habe ich hier geöffnet.
03:02
So sieht das ganze Tool aus. Also man hat links und rechts jeweils eine Auswahl von Vokabularen, die unterstützt sind. Also insgesamt haben wir weit über 100 große und kleine Vokabulare. Aber hier für Wikidata ist es erst mal nur eine Handvoll, die auch getestet sind. Und da ist zum einen Wikidata selber. Also das wähle ich hier als Quellvokabular aus,
03:25
weil wir mappen jetzt immer, wenn die Mappings in Wikidata gespeichert werden sollen, laufen die Mappings von Wikidata zu einem anderen System. Also wähle ich hier Wikidata aus und kriege ein paar allgemeine Informationen über dieses Wissensorganisationssystem.
03:43
Also beispielsweise ist es auch in Vodoc eingetragen. Und dann das Gleiche auf der rechten Seite. Ein Zielvokabular. Also dort zur Auswahl mehrere deutsche Vokabulare.
04:00
Also die haben wir vor allem, weil das ganze Projekt für Bibliotheksklassifikationen zuerst gestartet ist. Und aber auch ein paar internationale. Okay, ich nehme mal hier den STW-TESAUS für Economics. Das ist halt auch ein internationales System.
04:24
Und sobald halt ein paar von Wikidata und einem anderen Vokabular ausgewählt ist, kann ich hier schon sehen, welche Mappings sind denn in Wikidata eingetragen. Also das sind so etwa 2000. Und diese Mappings könnte ich jetzt in den Editor übernehmen.
04:43
Vorher muss man sich anmelden. Das habe ich schon vorher gemacht. Das Anmelden, das geht über den Wikimedia-Account. Also die gleichen Login-Daten, wie man bei Wikimedia verwendet. Wir kriegen da keine Passwörter mit. Das ist alles sicher. Wir speichern auch keine Zugangsdaten, sondern du könnt alle Leute, die in Wikidata mitarbeiten, auch direkt unser Tool nutzen.
05:05
Und sobald das möglich ist, kann man die hier bearbeiten. Und jetzt könnte ich zum Beispiel sagen, ne, das Mapping passt nicht. Das soll gelöscht werden. Oder das Mapping soll anders werden. Und man kann sich auch Informationen zu dem Mapping angucken.
05:20
Und einer der Links, der geht jetzt dann zu Wikidata, um sich mal anzugucken, wie das in Wikidata aussieht. Also das ist so die Standard-Vikidata-Oberfläche. Und dort würde halt dieses Statement bearbeitet werden, wenn wir in Kokoda dieses Mapping bearbeiten. Das Ganze zeige ich am besten mal in einem Beispiel.
05:45
Ja, am besten erst mal ein neues, also das hier lassen wir. Sondern wir wollen mal ein neues Mapping eintragen. Und zwar, wie sieht es denn aus hier mit neuen Themen? Corona, das gibt es anscheinend in dem STB-Telesaus noch nicht.
06:01
Pandemie, ah ja, also da ist ein Eintrag zur Pandemie. Jetzt sehe ich die Suche, die geht halt über Vorzugs- und Nebenbenennung. Das heißt, der Eintrag ist Epidemie in dem Telesaus, den es gibt. Aber es gibt hier als alternative Bezeichnung auch Pandemie, deshalb wird das gefunden.
06:21
Und das ist noch nicht in Wikidata eingetragen. Ansonsten würde es hier unter Wikidata-Mappings erscheinen. Es erscheinen stattdessen Vorschläge. Also diese Vorschläge, das ist die gleiche Technik, die in Open Refine verwendet wird,
06:40
wenn man damit Mappings gegen Wikidata fährt. Also im Wesentlichen eine Suche der Benennung. Also Epidemie und Epidemie in Wikidata hat den gleichen Namen. Deshalb ist es halt auch einfach zu finden. Und bei solchen Fällen, also ich könnte hier auch nochmal direkt die Besuche bemüßigen in Wikidata, aber bei solchen einfachen Fällen kann man über die Vorschläge gehen und sagen,
07:02
okay, das nehme ich und das kann ich entweder übernehmen, den Editor und dort noch bearbeiten oder direkt gleich abspeichern. So, ich hoffe mal, der Vorführeffekt, dass das jetzt schnell genug geht. Ja, Mapping wurde in Wikidata gespeichert. Und wenn wir jetzt auf den Eintag hier in Wikidata gehen,
07:23
dann müsste das auch dort direkt sichtbar sein. Also ich guck mal in die Versionsgeschichte. Da ist eingetragen, über die Anwendung. Okay, so, dann, das sind so die einfachen Fälle, so 1 zu 1 Beziehungen mit gleichem Namen.
07:43
Das dafür braucht man nicht unbedingt. Das ist zwar ganz hilfreich, dass man hier noch die weiteren Benennungen hat und die Hierarchie pausen kann. Aber interessanter wird es natürlich bei den komplexeren Fällen. Also ich nehme mal hier wieder die ausgewählten Begriffe voraus
08:00
und nehme ein Beispiel aus der Basisklassifikation. Die ist ganz schön, die ist halt nicht so komplex, also nicht so umfangreich. Und da sind sehr große Bestände in Bibliotheken mit erschlossen. Also wenn wir die vollständig gemapt kriegen gegen Wikidata, das wäre schon ganz gut. Ich guck mal in den Bereich hier Sport. Also ich kann über die Suche gehen oder über die Hierarchie pausen in dem Fall.
08:25
Und sowas wie Sport müsste ja eigentlich schon gemapt sein. Aber da gibt es halt noch ein paar einfache Fälle, die noch nicht eingetragen sind. Ja, also Sport ist Sport, sag ich mal, ja, übernehmen. Aber ich könnte so sagen, hier, das ist so.
08:42
Wikidata und Sport in der Basisklassifikation. Und was man eben bei OpenRefile nicht so gut machen kann, ist die Hierarchie rücksichtigen. Also beispielsweise hier zu spezielleren Themen die Geschichte des Sports.
09:04
Gibt es das in Wikidata auch? Ja, da gibt es zwar auch Geschichte des Sports. Aber in der Basisklassifikation geht es auch um Freizeitunterholung und Sport. Deshalb sollte man in der Basisklassifikation nicht nur eine 1 zu 1 Beziehung, sondern eine Beziehung der Schür.
09:32
So, hier gibt es leider ein paar Tonschürungen. Ich kann jetzt gerade, Eva, jetzt kann ich dich nicht hören. Du musst dein Mikro anmachen. Okay, genau. Ich wollte gerade sagen, dass das wirklich bei mir sehr knistert.
09:44
Aber jetzt gerade klingt es wieder gut. Ich habe überlegt, ob das Mikro vielleicht einen halben Zentimeter weg vom Mund, ob das was hilft. Ja, schade. Aber wir machen sowieso noch mal einen Screencast, auch auf Englisch.
10:00
Also hoffen wir mal, dass es trotzdem so verständlich ist. Mache ich einfach mal weiter. Also wo ich bei war, ist, dass es mal mit Kokoda auch die Hierarchien sich ansehen kann. Und dann so eine Beziehung wie der Geschichte des Sports in Vigidata ist halt was Spezielleres als die Geschichte des Sports der Freizeitunterholung in der BK. Also sollte man hier dann einen Beziehungstyp auswählen.
10:25
Und gerade bei den Hierarchien entdeckt man dann so Sachen. Aha, wir hatten hier weiter übergeordnet Sport als Sport zugeordnet. Aber wenn Geschichte der Freizeitunterholung auch untergeordnet ist zwischen unter Sport hier, dann heißt Sport in der Basisklassifikation wahrscheinlich ein bisschen was mehr als nur Sport in der Vigidata,
10:47
sondern da gehört halt auch so Freizeitunterholung dazu. Das heißt, diese Beziehung, die wir eingetragen haben, dass das das Gleiche ist, ist eher auch nicht genau, sondern Sport in Vigidata ist spezieller, also sollte das auch korrigiert werden.
11:03
Okay, und das landet alles direkt in Vigidata. Und die Mappings, die hier schon in Vigidata eingetragen sind, also erscheinen halt hier in der Suche, in der Mappingübersicht und in der Baumansicht mit so einer grünen Markierung. Also hier kann man schon sehen, welche Konzepte haben denn überhaupt Mapping.
12:13
So, einmal kann ich hier die Hierarchie mir auch angucken in Vigidata. Und ich erhalte einmal die Vorschläge aus Vigidata,
12:25
weil in Vigidata Begriffe mit der gleichen Benennung auftauchen. Oder ich erhalte hier Vorschläge umgekehrt von Vigidata auf die BK, das dann in der BK gesucht wird. Und hier bei den Vigidata Mappings werden mir auch Mappings zu anderen Vukabladen angezeigt.
12:45
Also auch welche, die hier zur Bearbeitung noch nicht unterstützt sind, beispielsweise Medical Subject Headings. Das kann man in Einstellungen auch abstellen, ob ich die mit angezeigt haben möchte. Oder wir warten einfach bis unser Team das auch unterstützt,
13:02
dass Medical Subject Headings genauso bearbeitet werden können über das Tool hier. Ansonsten haben wir noch ein paar andere. Icon Class ist beispielsweise ganz interessant für die Bildersuche und zur Motivation, warum das Ganze.
13:24
Da ist halt eine schöne Sache, dass wenn wir mehr Mappings haben, dass so eher können wir auch in die Bibliotheksbestände reingehen. Hier die Basisklassifikation. Wenn man eine Klassifikationsnummer hat, lässt sich ein Link erzeugen
13:41
und dadurch halt in den Bibliothekskatalog direkt reinspringen oder über Schnittstellen diese Liste der Literatur abrufen. Das heißt, es wäre was möglich, ich gehe aus von einem Wikipedia-Artikel und beispielsweise über Personalwesen und über die,
14:00
also hier kann ich die deutsche Wikipedia mal aufrufen, also es wäre halt möglich, dass in diesem Wikipedia-Artikel und hinten unter Literatur automatisch eingeblendet wird, aha, in WGData steht drin, welcher GND-Eintrag ist das? Und in der GND, welcher BK-Eintrag ist das? Und in der BK, darüber kann ich halt an diese Literaturliste gelangen.
14:22
Ich denke mal, das ist einer der hilfreichen Anwendungsfälle. Ja, andere Anwendungsfälle hatte Andrea schon im vorigen Vortrag gezeigt, also die Analyse von Begriffsystemen. Ja, aber da ist bestimmt noch viel mehr möglich. Ja, also ich bitte, das mit dem Ton zu entschuldigen.
14:44
Müssen wir mal gucken, woran das lag. Und jetzt ist noch Zeit für ein paar Fragen. Ich kann ja auch mal die... Du shares das, Irvab hat wieder, genau.
15:09
Willst du dir eine Frage aussuchen? Ja, ja. Du brauchst mich gar nicht. Also eine Frage, wo es Möglichkeiten gibt, Fragen zu stellen über Kokoda.
15:20
Also wenn es um irgendwelche Funktionen geht, es ist Kokoda halt alles als Open-Source-Tool bei GitHub. Man kann halt da diese GitHub-Issues nutzen. Das allerdings, ja, also da werden wir auf jeden Fall reagieren. Ansonsten auf der Polycon-Homepage,
15:43
also von dem Projekt, da gibt es auch Kontaktadressen, also entweder uns direkt anmelden oder Twitter oder unsere allgemeine E-Mail-Adresse. Also wir freuen uns immer über Feedback. Das Ganze in Englisch, ja,
16:01
ich werde einfach noch mal einen Screencast machen von dem Ganzen. Ich muss halt nur englische Beispiele raussuchen und das Ganze gleich noch mal auf Englisch machen. Dann stellen wir das zur Verfügung. Zu der Frage so. Dann, wer, who is the main individual user?
16:20
Also die Hauptanwender. Kokoda wurde entwickelt vor allem für Bibliothekssysteme. Das heißt, wir wollen die Regensburger Bibliotheksklassifikation und die Dual-Decimal-Klassifikation auf die Basisklassifikationen beispielsweise mappen, sodass Bibliotheksbestände aus unterschiedlichen, die mit unterschiedlichen Systemen erschlossen sind,
16:42
trotzdem einheitlich durchsucht werden können. Und das sind so die anvisierten Nutzer aus dem Bibliotheksbereich, während hier für das Wikidata-Mapping, denke ich, eher das Leute aus dem Wikidata-Umfeld da mitmachen. So, nächste Frage.
17:03
Ja, wie werden diese Vokabularien ausgesucht? Warum ist die UDC noch nicht dabei? Also die Liste der Systeme, die wir unterstützen, hängt, ist mehr eine technische Sache. Also ich nehme mal hier die Hauptinstanz, wo alles drin ist, da haben wir 171 Vokabularien.
17:20
Da sind auch viele kleine internen dabei, die nicht so von großem Interesse sind. Ansonsten nehmen wir eigentlich alles, was wir bekommen können. Das Problem ist, wenn das System nicht frei zur Verfügung steht. Also die Zens-Fragen muss erst mal geklärt sein. Und die technische Konvertierung in das Format.
17:40
Also wir haben so ein JSON-basiertes Format, wo auch Tools bereitgestellt werden zur Konvertierung. Aber das ist natürlich immer doch noch ein bisschen Arbeit. Irgendwer muss das erst mal anfassen und dann einspielen. Das machen wir eher so auf Zuruf. Und UDC wäre natürlich auch ein toller Kandidat, damit einzuspielen. Das machen wir gerne.
18:07
Eine technische Antwort, wenn es irgendwie möglich ist, ist die Software Scosmos, die sehr verbreitet, um Vokabularien zur Verfügung zu stellen. Wenn man selber einen Vokabular und das in der Scosmos-Instanz laut zu laufen hat, dann können wir es auch direkt anbieten. Ansonsten müssen wir das erst mal konvertieren.
18:25
Noch eine Frage. Ein Beispiel habe ich schon gezeigt, die Anzeige von Literatur aus Bibliothekskatalogen
18:41
zu Wikipedia-Artikeln. Aber auch umgekehrt, wenn ich in Literatur habe, wäre es schön mir da zu passenden Themen, zu den Themen, andere Bilder, Medien und Literatur zu zeigen. Ich denke mal, die Vision ist schon,
19:01
dass es für das Retrieval genutzt werden soll, weil diese ganzen Vokabularien ja nicht selbst weg sind, sondern sollen mir eine Übersicht verschaffen. Zwei, drei Minuten haben wir noch eine Frage. Wo würde man am besten Indikationenmappings aufgelöst, wenn es ein Mapping von VK auf RK gibt, auf Wikidata?
19:22
Ach so, wenn ich zwei Mappings habe und daraus manchmal ein drittes automatisch erschließen, da haben wir noch nicht ein eigenes Tool für, also Statistiken drüber laufen zu lassen. Das muss man bisher die Abfragen gegen unsere Datenbank direkt machen.
19:45
Aber da planen wir auch noch weitere, so Qualitätssicherungshinweise einzublenden. Das ist auch Teil der Zukunftspläne. Das Ganze immer weiter ausbauen. Also da gerne mit Hinweisen und Ideen ankommen,
20:01
die wir dann einbauen können. Die letzte Frage ist eine sehr gute Frage. Wie gehen wir um mit Versionen? Mit die Klassifikationen verändern sicher, haben wir auch gerade gehört. Da müssen wir zugeben, dass wir das Thema noch so ein bisschen nach hinten geschoben haben. Also wir haben zwei, drei Systeme, die haben wir einfach doppelt drin, einmal in einer alten Version, einmal in einer neuen,
20:20
die dann eigens gemappt werden müssen. Erstmal ist der erste Schritt, die Systeme überhaupt in irgendeiner Form zugänglich zu machen und einheitlich über das Tool und über Schnittstellen abrufbar und mapper zu machen.
20:40
Alle Systeme, die wir bekommen können, beispielsweise RVK, speichern wir auch die alten Versionen. Aber diese Verbindung von der alten zur neuen Version, was hat sich denn da geändert? Das haben wir bisher nur für die GDC in einem anderen Tool. Ja, also das ist noch für die Zukunft.
21:01
Okay, jetzt bin ich um und habe auch die Fragen beantwortet. Genau, wir haben wieder eine Punktleitung geschafft, in zeitlicher Hinsicht. Wunderbar.