Integrierte Entwicklungs- und Publikationsumgebung für Forschungssoftware und Daten am Helmholtz-Zentrum Dresden-Rossendorf (HZDR)

Video in TIB AV-Portal: Integrierte Entwicklungs- und Publikationsumgebung für Forschungssoftware und Daten am Helmholtz-Zentrum Dresden-Rossendorf (HZDR)

Formal Metadata

Title
Integrierte Entwicklungs- und Publikationsumgebung für Forschungssoftware und Daten am Helmholtz-Zentrum Dresden-Rossendorf (HZDR)
Title of Series
Author
Contributors
License
CC Attribution 3.0 Germany:
You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor.
Identifiers
Publisher
Release Date
2019
Language
German

Content Metadata

Subject Area
Abstract
Mit dem Ziel den gesamten Lebenszyklus wissenschaftlicher Artikel, Forschungssoftware und Daten in Vereinbarkeit mit den FAIR-Prinzipien zu unterstützen, wurde am HZDR eine integrierte Entwicklungs- und Publikationsumgebung geschaffen. Insbesondere die Publikation von Forschungssoftware und Daten erfordert eine technische und organisatorische Infrastruktur. Oft ist auch ein intensiverer Wissensaustausch und die Unterstützung der Wissenschaftler notwendig. Die Hürde zur Veröffentlichung sollte durch Automatisierung und Integration verschiedener Plattformen möglichst klein gehalten werden. In diesem Vortrag wird der aktuelle Stand, Erfahrungen und Herausforderungen gezeigt, die bei der Bereitstellung einer derartigen Umgebung gemacht wurden.
Loading...
Sign (mathematics) Word Computer cluster Repository (publishing)
Source code Surface Software Particle detector Thermal radiation Mathematical analysis Set (mathematics) Gamma function Power (physics) Laser
Software Software Löschen <Datenverarbeitung> Plot (narrative)
Cluster sampling Service (economics) Ende <Graphentheorie> Particle detector ALT <Programm> Mathematical analysis Complete metric space Digital object identifier Metadata Supercomputer Data management Component-based software engineering Component-based software engineering Software Telecommunication Software repository Software Repository (publishing) Ecke Simulation Local ring Design of experiments
Constraint (mathematics) Service (economics) Höhe Decision theory Computer file Limit (category theory) Limitierungsverfahren Open set Systems <München> Software Band matrix Software Spacetime Process (computing) Gamma function Datenformat Local ring Vapor barrier Computing platform Row (database)
Server (computing) Link (knot theory) Server (computing) Computer file MIDI Data storage device Control flow Statistics File Transfer Protocol Computer file Web application Sheaf (mathematics) Data center Physics Simulation Form (programming)
MIDI Row (database)
Drag (physics) Medical imaging Computer file Web browser Computer file
Email Drag (physics) Sine Route of administration Hand fan Row (database)
Instanz <Informatik> Software Zeno of Elea Server (computing) Computer file Software Disintegration Data storage device Instance (computer science) Control flow File Transfer Protocol
Standard deviation Service (economics) Distribution (mathematics) Direction (geometry) Collaborationism File format Metadata Local Group Force Data management Data model Software Repository (publishing) Embargo Computing platform Operations research Service (economics) Standard deviation Email Control engineering Internet service provider Core dump Set (mathematics) Open set Frequency Software Software repository Erweiterbarkeit Internet service provider Computing platform Task (computing) Row (database)
Befunde die Haut zu ermöglichen ist sehr
oder einfach denke morgen in so
jetzt genau bevor wir weitermachen möchte ich kurz noch mal das wir dass der ganze einordnen
können für was wir das eigentlich tun paar Worte zum hat sie der verlieren also wissen auch Mitglied der Helmholtz Gemeinschaft müssen ungefähr 1200 Mitarbeiter Standorte in Dresden aber auch noch 4 weitere verteilt in Deutschland und in Grenoble und ja
neben der sehr diversen Landschaft an wissenschaftlichen Einrichtungen würde ich sagen gibt es auch 3 Großforschungseinrichtungen ist einmal das Elbe Zentrum für Hochleistungs Strahlenquellen das Hochfeld Magnet Labor Grund das Ionenstrahl Zentrum ab und da kann man sich vorstellen das sind Detektoren das in Messinstrumente die erzeugen die ganze Menge von Daten mit hohen Bandbreiten und ja die muss man irgendwie handhaben und das ist in der ZiB unsere Aufgabe und
da natürlich die Frage Ja wo packt man die denn nun hin also alles was hier dargestellt ist auf jeden Fall die falsche Entscheidung wenn das könnten nur dort liegt er die Sachen können
verlorengehen man kann sie aus Versehen löschen Hardwaredefekte sind nie auszuschließen und selbst wenn die Daten da sind und man weiß wo sie liegen dann in meinen einmal Lieblingscomics 4 dann fehlt vielleicht die
Dokumentationen und weiß nicht was mache ich denn damit jetzt überhaupt wie wird sich die Software und dann kommst doch oft dazu dass der Doktor dann doch noch mal von 0 anfangen muss und das ist natürlich dann schade die vom die Arbeit die vorher rein gesteckt wurde genau und
aus dem Grund habe es auf die Fahne geschrieben die 4 Prinzipien die ja schon an allen Ecken und Enden verwendet werden umzusetzen sozusagen und wenn man sich jetzt mal ansieht wie heutzutage Sonderpublikationen im Journal aus welchen Komponenten die zusammen geht also das hat kein Anspruch auf Vollständigkeit aber die die Ergebnisse die werden auf Basis ganz oft auf Basis irgendwelche Daten erzeugt damit man da überhaupt Ergebnisse aus bekommt braucht man Software die die Daten auswertet und dann spielen natürlich noch sowas wie persistente alt denn die Feier und irgendwie auch die Autoren der Rolle und alle das Werk wenn uralten wenn nur wenn Alters zusammenkommen dann kann man es auch schaffen dass so eine Publikation Änderungen wieder reproduzierbar und wieder also überprüfbar ist für den für den Leser sozusagen er genau
und bei unserm hat sie der er läuft das dann aktuelle im Prinzip ganz häufig wie folgt dabei so die Großgeräte bei den gibt es dann sozusagen zum propose System also interne und externe nutzt auch die müssen einfach nen Messzeit Antrag stellen beschreiben dort schon das 1. Mal was sie tun wollen also geben dort eigentlich schon das 1. mal so ein paar Metadaten an was denn eigentlich für den Messung gemacht werden soll dann wurde der Messe Antrag genehmigt und man kommt zu dem Punkt wo man jetzt Daten auf einem wo man dann wieder neue Metadaten generiert also in dem Fall dann er die Steuer Elektronik von dem Detektor oder ist bin unendlich viele Dinge und im Optimalfall hoffen wir dann das wenn der Nutzer die Sachen dann gleich noch mit in dem elektronischen abrupt Buch dokumentiert also sich Leser ab ausgefallen um 14 Uhr 24 dann hat man auch noch mal einen zusätzlichen period um die Experimente Experimente die ablaufen besser Nachfol- ziehen zu können genau und wichtig ist dass alles was man hier sieht einfach gut ineinandergreift genauso wie die Software die dann irgendwo entwickelt wird Zeit aufgeklärt aufgeht verworfen und die lokalen title Repository Tierkörper so toll wo auch immer er hat das muss einfach gut ineinandergreifen und am Ende ist dann unser Ziel dass die Daten dann und unsere Daten und Daten und Software in unserer Daten Publikationsplattform landen und die haben wir genannt genau hier um
einen in Screenshots von Notaren Amphoren schon den Namen 10 oder gehört die weiß nicht wer von ihnen G R 10 oder schon mal benutzt sind es einige hier ich denke die meisten erkennen das sehr gut wieder wenn man sich das optische mal ansieht oder so auch kein Zufall denn das ist in den 7 fort von 10 oder Oh er und an der Stelle kann man sich vor mir gut da hätte die auch gleich 10 oder verwenden können das ist richtig das Problem ist aber dass wir Datensätze erwarten und auch schon publizieren mussten die einfach die Beschränkungen dies bei Zenodot gibt über ihre Reisen und wir einfach größere Datensätze publizieren müssen selbst wenn wir dort unendlich viel Speicherplatz hätten dann hat man dann natürlich immer noch in der lange Leitungen also mit Bandbreiten Limitierung dieser ein weiteres Problem ist und uns war es wichtig dass die verschiedenen Systeme dann irgendwann möglichst gut miteinander integriert sind wir hatten den Eindruck dass das leichter geht wenn man das System dann unter der eigenen Kontrolle hat und deswegen die Entscheidungen zu dem Zeitpunkt als wir das entschieden aber 10 oder oder in wenn einfach die Plattform die gezeigt hat dass sie mit vielen vielen Einträgen auch mit großen Datenmengen umgehen kann das war bei anderen einfach aus unserer Sicht nicht so stark der Fall genau das System das ist jetzt seit
ungefähr ein bisschen mehr als im Jahr einbezieht wie würde ich sagen und da kann man dann natürlich schon die 1. Erfahrungen machen wie jene die dort nutze das an wo sind würden die man vielleicht die die nutze abhalten das Ganze zu nutzen und die 3 größten aus meiner Sicht die schön Unterhaltungen so mitgenommen habe habe ich immer aufgenommen also ganz häufig hat man den period okay das klingt alles schön und gut was Sie da erzählen aber was bringt mir das und für wen soll ich das eigentlich machen das brauche ich nicht er in dem Fall also das ist wirklich ein schwieriger Überzeugungsprozess den man da fahren muss was ganz häufig hilft es gibt immer mehr Journale die dort auch wirklich klare Anforderungen stellen und sagen wir veröffentlichen das schon der den Artikel nur wenn ihr uns auch Software und Daten dazu liefert oder halt zumindest referenziert weil sonst kann man ja ein Narr kann man sonst was verkaufen wenn sein Held und kann es nachprüfen und das ist auch der Punkt wo die nutzt am meisten zugunsten kommen und sage ok können wir uns da irgendwie helfen habe die da was wie machen wir das der ja dann kommt der Punkt also neben dem nicht einsehen dass es da als manches sind vielleicht ein denken sich aber okay der der die würde das zu tun die mir einfach zu hoch das mache ich nicht mehr so wichtig dass man etwas veröffentlicht wird wenn es brauche ich nicht und ich denke da kommen auch noch mal auf den Punkt zurück wo man sagen muss dass es wirklich wichtig ist dass man die Sachen die die Leute die Dienste die die Leute so und so schon nutzen gut miteinander integriert sind weil wenn der Aufwand gering es von dem System wo man seine Daten eh schon liegen hat sie dorthin zu bekommen und sie dann veröffentlicht hat wenn der kleines dann ist natürlich auch die Höhe der geringer das zu tun und abschließend ist dann auch so das Thema des altes das Wissen über wie man macht man es denn richtig auch an vielen Stellen einfach noch nicht da und ich denke da comma nicht vom als dort einfach Trainings Support anzubieten und den Leuten sagen Art die Lizenzen sind zu sind zu empfehlen welche Datenformate sollte man nutzen und also da kann man sich ganz viele Fragestellungen vorstellen was das angeht ja genau ich möchte es noch mal so ein
paar Integration in die wir gebaut haben also vorstellen eine nochmal Life zeigen uns denn nun Feature das Gepäck grau und Ablaut genannt haben bei uns ist es so dass also die die Dateien die Daten liegen schon ganz häufig im Rechenzentrum auf zentralen Servern es sind dort aber noch unter der Kontrolle von Nutzer als der Nutzer kann dort die Sachen schon erkannt verschieben und das ist natürlich schöne Lanzen langfristiges aufheben in Form von so einer Webanwendung das ja eigentlich nicht machbar deswegen muss man sie also irgendwie in die Kontrolle der Anwendung bekommen die Daten er standardmäßig findet man da meistens einen bergab lohnt es aber dann Abwürgen der größte bisschen unhandlich würde ich sagen und einfach zu fehlerbehaftet und deswegen wir uns dann für die Lösung entschieden die MS FDP genutzt und sozusagen über eine Weboberfläche der Nutzer dem Nutzer ermöglicht er Daten hochzuladen ohne dass ermöglicht aufmachen warten musste sie hochgeladen sind und das wollt ich jetzt einfach mal kurz zeigen wie das bei uns aussieht ich hoffe ich komme mit der Bedienung zurecht ja geht es geht gar nicht eigentlich die Maus gut ein bisschen ist auch meinen sie müssen ihren außer wie er wir an ich kann ja also was wird meine Finger zu mir genau das muss man Jahr und so wie es sich keiner Wahl 11 also wir gehen jetzt hier sozusagen auf den den Fall hier das ist das ein bisschen H wäre
hier alles klar na gut dann machen wir das so dann wäre das nicht für den Tipp genau so dass sie erst mal die Oberfläche also erst muss der Nutzer einrichten die Anwendung braucht im Wiener Möglichkeit überhaupt per SFTP auf den zwar wo auch immer die Daten liegen zugreifen zu können wenn es sein wird so gelöst dass der Nutzer einmalig hier sein
kaum verknüpft und in dem Schritt wird dann in es ist nur Pieper erzeugt den Mut habe ich habe man es ist per erzeugt mit dem dann die Anwendung auf
die Datensätze eben zugreifen kann er der Nutzer stellte hat kann sich da nicht hier
sondern im Ablaut darstellen und wenn jetzt hier
ab im klickt dann kann entweder seine Dateien einziehen und es ist normale der oder nutzt diesen Browsern auf Datei brauchen im Browser wo man das nennen möchte und navigiert sich dann hier
zu seiner Datei das mache ich jetzt einfach mal mir nicht als hingelegt und genau ich
nehme hier nur was kleines und er geht dann hier einfach auf Ablaut feil und das ganze wird dann hochgeladen und der bekommen die Email wenn das Ganze dann fertige sind auf die Weise wie ist es dann auch wirklich einfach möglich sehr große Datensätze unter die Kontrolle dieser
Anwendungen zu bekommen das ich was was sehr gerne angenommen wird bisher und was erstaunlich gut geklappt hat wie ich finde es jetzt ja wieder hier zurück er
genau damit habe ich viel über Daten gesprochen es geht natürlich auch hier und Software und die ist mindestens genauso wichtig und bei 10 oder ist es ja so dass es eine Integration für geht habe bereits gibt dass man als zeugt aufgeht hat nen neuen Willi ist das ist 17 oder wird darüber benachrichtigt Unterholz holt sich dann dies ist die den aktuellen Stand des verpasste Tories und zeigt einen neuen Eintrag mit deut und so weiter und es gibt ganz viele Wünsche dass es auch mit er geht leer passiert aus dem Grund haben wir uns entschieden das einfach mal zu implementieren die funktioniert dann ziemlich ähnlich diese Integration wie die bestehende gibt hat Integration bloß eben mit Kettler oder der privaten Instanz und wenn wir haben hier noch mal die die URL wurde die Akte Entwicklung aktuelle stattfindet das wurde natürlich primär für unser und da das System entwickelt aber ich bin auch guter Hoffnung dass wir das dann in 10 oder Oh mein bekommt und dort dann der gibt der Indikation auch zu Verfügung stellen kann da kommt dann auch am Ende doch mal kurz was dazu genau neben der
guten Integration habe ich ja gesagt dass auch wir haben hätte galt Lainz vielleicht helfen kann oder verpflichtenden Regelungen wie einfach damit umgegangen werden muss und das sind bei uns und hat sie der erst seit letztem Jahr nahe Peter Polle sieht doch unser Vorstand verabschiedet und verpflichten gemacht und dem ist festgelegt wer ist verantwortlich für das Hochladen von Forschungsdaten wie mussten Daten der dann meine plane zeugt werden welche Lizenzen werden empfohlen und das gibt vielleicht den Leuten dann auch noch meine werden Weg vor wie man damit umgehen kann man das sich nicht so unsicher was darf ich denn nun das darf ich nicht genau das gleiche es aktuelle ist mit der Software geplant ich glaube da läuft auch gerade Workshop parallel oder das ist morgen bin ich mir nicht sicher mit der Helmholtz Tanzclub ob und da gibt es aktuelle den 1. traf von der Vorlage und in der befindet sich aktuell in der Abstimmung mit Technologietransfer Juristen und so weiter und ja dann hoffen wir mal dass so was dann auch für Software in absehbarer Zeit bei uns entsteht und es wurde jetzt auch der der die Wichtigkeit erkannt aus meiner Sicht dass man da wirklich jemand braucht der die Leute unterstützt in Tränen gibt und unsere Bibliothek dafür zu nennen der Ätherleib darin einstellen der dann genau diese Aufgabe hat den Nutzern eben zu helfen bei genau den Fragen die von angesprochen habe er
genau ich habs gerade noch mal gesagt auf vor noch mal gesagt rot aber was sie da im Prinzip auf 10 Udo und ja also das wie wie wir an hat sie die der aber nicht die einzigen die das gemacht haben das waren ne ganze Menge von Institutionen sich glaube 10 oder 11 die den gleichen Weg keinen Sinn zumindest die ich kenne und das darauf sie natürlich auch die Leute von Sinn oder aufmerksam geworden und haben da mit uns gesprochen gesagt ja wenn wir die Kräfte bündeln wir das schaffen wir doch bestimmt eine fundierter Basis zu bauen und da es dieses ist wurde in Venio RDM genannt Projekt entstanden das in 2 oder 3 Wochen der Klick auf dazu und der Plan ist dort dass man einfach er Suzanne gemeinsame Plattform baut die Support erhält die einen klaren ablädt Fahrt hat die einfach installierbar ist und das dann sowohl 10 oder als auch die anderen Repositories in Zukunft auf diesem in RDM passieren und man ist einfach einfacher hat er die also nochmal die 3 Ziele die da gesagt wir das wir einfach von innen Repository haben oder ein Angebot wo man ein erweiterbares Metadaten Schema hat das passiert auf dem Täter Zeitschema soll in der Lage sein will die Millionen von Einträgen und er Tsd von Daten zu Händen also was 10 oder im Prinzip schon macht was aber dazu kommt ist das ist halt einfach ein ordentliches Bett Beckettschen geben soll also bisher ist es sehr viele also bitte keine Sache die man 5 Minuten macht es zum Laufen zu bekommen also muss man sich schon sehr lange damit beschäftigen folgen ohne Anleitung bis zum Laufen zu bekommen und das soll einfach wesentlich besser werden dadurch und ich denke dadurch ist es dann noch möglich sei okay auch in da haben wir gute Basis um damit weiterarbeiten zu können genau nochmal zusammengefasst was ich gesagt habe also ich denke es ist absolut wichtig dass die angebotenen Dienste alle möglichst gut miteinander integriert sind man muss Metadaten und Dokumentation möglichst frühzeitig und so früh wie möglich und kontinuierlich betrachten und ich einfach erst am Ende weil das habe auch gehört am Ende machts keinen mehr er das Ganze sollte so automatisch wie möglich passieren und der Nutzer der braucht einfach auch per sind oder angepasstes und individuelles Training aus meiner Sicht und das sinnvoll machen zu können und aus von den Service Provider wie wir es ja dann erst sehen würde ich sagen dass also die Administration von so einem System möglichst einfach sein kann umso weniger Fehler können dann natürlich auch passieren und umso sicherer aus meiner Sicht die Daten es muss einfach weiter und anpassbar sein einfach auch um diese Integration gut implementieren zu können und aus meiner Sicht auch ganz wichtig dass man auf breit akzeptierte Standards setzt weil ansonsten kocht man dann nur sein eigenes Süppchen und ist dann nicht austauschbar mit anderen das System den also wie es ist auch wichtig für uns dass wir auf anderen System auftauchende niemand geht auf und da der wohnt hat sie der Erde und suche direkt nach dem Datensatz und der kommt er von woanders und wird dann dorthin verlinkt also deswegen ist es wichtig dass man da einfach entsprechend integriert genau damit bin ich auch am Ende dann da wenn Sie herzlichen Dank für die Arbeit und den Vortrag das sind jetzt fragen geändert wenn ich das mal her die wie portabel ist denn Euer System man schon also wenn jetzt mein Institut entscheiden würde wir hätten auch gern so ein System mir oder aber wollen das jetzt implementieren bei uns wie kompliziert wird das also ist man muss sich ja der also es ist Fehler wenn man weiß wie's geht hat man das ganze innerhalb von kurzer Zeit gemacht also wir es also mit mit Unterstützung würde ich sagen dass man das in ein 2 Tagen hinbekommen hat wenn man alles von 0 an da inzwischen auch besser geworden was die Dokumentation angeben zu Anfangszeiten als wir angefangen haben war das in wenn ja noch im Alfer Stadium ohne Dokumentation und so weiter also es war ja schwere Zeit künftig setzt wenn ich jetzt ist es inzwischen auch besser geworden was die Dokumentation angeht und ich hoffe auch wirklich das was ich am Ende gezeigt hat dass es auch noch mal der wirklichen Schritt vorwärts ist das Ganze nochmal auf solidere Beine zu stellen wer ja also wir können da gerne mal im Nachhinein Einträge überlegen wie man das dann dem wie das im Detail funktionieren würde so auf ja ich werde nicht was mich interessieren würde ist es dann auch möglich prinzipiell da endlich Ex ist bereits auf die Daten zu setzen also Mandaten hat hat die man gezielt freigegeben wird ist ist möglich oder ist es angedacht weil wir natürlich mit den medizinischen Daten immer nicht so ja und lädt auch es rausgehen in also es gibt in 10 oder und auch bei unserem System jeder gibt erst mal 4 verschiedene Zugriffsrechte also Opern Embargo und wißt richtet und Klos also es wären wahrscheinlich dann wisst wütet und Klaus den das wir so Klaus Theis ist darf nur der Besitzer sehen und ist schüttet hat dann kann jemand 3. die Möglichkeit Sonne Zugangs Anfrage zu stellen sozusagen also er wenn ich viel zu zeigen dass ich glaube er geht dann einfach geht auf den Datensatz drauf da steht dann so was wie wie Qwest Exzess dort gibt er dann seine Email-Adresse ein das man eine kurze Erklärung warum er das denn haben möchte und dann bekommt der Besitzer des Datensatz ne Email und kann den dann freigeben oder das ganze ablehnen und dann bekommt derjenige sondern geheim Leben wie man vielleicht von Box oder so was kennt der dann auch Ablaufdatum hat also in dem System aktuelle funktionieren 2 ja danke noch macht den Vortrag und nun gibt es ja auch schon ganz aktive Community so in dem Bereich Daten Repositorien einmal fällt mir da ein Sie dies per ist es doch wieder die Fahrt verarbeitet aber und jetzt in den die die klingt so ein bisschen in die gleiche Richtung was was ist das besonders neue tolle an diesem Projekt er hat also das ist er also in dem Jahr die er müsse man sieht nur noch meine also Zenodot alles einfach installierbar das Paket wir hatten uns damals als wir entschieden haben uns die diesen Weg zu gehen haben wir uns auch dies bei ist und ich würde sagen die es gerade alle nicht nur ein aber alle an geschaut und also allein von dem es war also entweder hat einfach aus unserer Sicht die modernste und auch am einfachsten erweiterbare Plattform geboten hat moderner Webtechnologien verwendet mit Elastic Search im Hintergrund und also das das hat für uns einfach den am besten skalierbaren Eindruck gemacht und mit 10 oder hat es ja auch mehr Installation gehabt die eigentlich schon gezeigt hat dass es gut skalierbar ist und das war auch der Grund warum wir diesen Weg gegangen sind ja mehr er war und der kann das System dann auch die GUI Zeugen wenn wenn der ist kann man es einfach so machen oder muss man es irgendwo herum registrieren noch eine wir mussten uns bei der T in Hannover registrieren sozusagen als wir wie institutionelles Mitglied sozusagen dann erhält man Zugang zu diesen der das seit Service über den man Deußer gestern kann wie genau dieser Prozess abläuft kann ich nicht sagen das habe ich nicht selber gemacht aber ist auf alle Fälle möglich und kostet glaube ich auch für gesichert ist jemand weiß für öffentliche Institutionen die keine nicht auf Profit ausgelegt sind kein Geld aber da müssen wir jemand fragen der das genau war es ja so
Loading...
Feedback
hidden