We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Open Data @Greenpeace e.V.

00:00

Formal Metadata

Title
Open Data @Greenpeace e.V.
Title of Series
Number of Parts
119
Author
Contributors
License
CC Attribution 4.0 International:
You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor.
Identifiers
Publisher
Release Date
Language

Content Metadata

Subject Area
Genre
Abstract
Es wird über die Einführung eines offenen Datenportals von Greenpeace Deutschland berichtet. Dabei wird aus der Praxis berichtet : welche Software wurde warum ausgewählt, welche (un)erwarteten Hürden gab es bei der Einführung/Entwicklung
Keywords
14
67
Gastropod shellPlane (geometry)Field (mathematics)Direction (geometry)Aktion <Informatik>State of matterTable (information)KommunikationRaw image formatSoftwareInformationSmart cardOpen setLevel (video gaming)Impulse responseTelecommunicationSelf-organizationIntegrated development environmentMachine visionRoutingCivil engineeringMultiplication signWeb portalGroup actionField (computer science)Archaeological field surveyMathematicsUniverse (mathematics)BitOffice suiteMoment (mathematics)Point (geometry)Computing platformPhase transitionLecture/ConferenceComputer animation
File formatData qualityPivot elementDirection (geometry)Row (database)MikroarchitekturGrand Unified TheoryProcess (computing)LinieInformationPainter <Programm>Similarity (geometry)Template (C++)Self-organizationPerformance appraisalProcess (computing)Term (mathematics)Level (video gaming)SoftwareMultiplication signWave packetSet (mathematics)Address spaceTask (computing)FeedbackAreaObservational studyElectronic mailing listLine (geometry)Selectivity (electronic)BitClassical physicsProduct (business)Maxima and minimaComputer architectureMereologyProjective planeData structureExpert systemArithmetic meanProper mapComputer animationLecture/Conference
Set (mathematics)Uniform resource locatorCuboidSource codeGeometryDifferent (Kate Ryan album)Direction (geometry)BitAreaQR codeMeasurementCASE <Informatik>MetadataInformationMereologyRow (database)IMPACT <Programmierumgebung>Lecture/Conference
Ja, hallo. Schön, dass ihr alle da seid. Der Jonathan Niesel wird uns was dazu erzählen, wie Open Data bei Greenpeace eingeführt wird. Herzlich willkommen. Vielen Dank.
Genau, ich bin Jonathan, ich arbeite in der Tierabteilung von Greenpeace, bin also meistens nicht auf dem Schiff hier unterwegs und darf euch heute etwas über unser neues Open Data Portal erzählen. Zum Start gibt es erstmal ein paar Informationen zu Greenpeace selbst. Die meisten von euch wissen wahrscheinlich, Greenpeace ist eine international tätige Umweltschutzorganisation.
Wir sind in circa 55 Ländern mit Büros aktiv und es gibt ungefähr 3 Millionen Menschen weltweit, die für Greenpeace spenden. Dazu gibt es etwa 48.000 Menschen weltweit, die sich für Greenpeace und den Umweltschutz engagieren. Davon ungefähr 7.000 Menschen in Deutschland. Die meisten machen das über unsere Community-Plattform Greenwire
oder sind aktiv in den 1 von 100 Ortsgruppen in über 100 Städten in Deutschland. Noch ein paar Prinzipien, wie wir arbeiten. Wichtig ist bei uns, dass wir international tätig sind, das heißt wir fokussieren uns nicht nur auf Umweltschutzziele in Deutschland, sondern auf der ganzen Welt. Wir sind politisch und finanziell unabhängig, das heißt wir nehmen kein Geld aus der Politik oder von Unternehmen an
und können somit sicherstellen, dass wir frei unsere Meinung sagen können. Wir machen direkte und gewaltfreie Aktionen, das ist wahrscheinlich das, was die meisten Menschen kennen. Wir gehen immer mit unseren Körpern direkt dorthin, wo die Probleme sind und zeigen sie dort auf.
Die Ziele der Greenpeace-Kampagne in Deutschland umgesetzt werden, sind immer welche, die auch auf internationaler Ebene wichtig sind. Also internationale Arbeit. Jetzt habe ich hier ein paar Steps übersprungen. Diese genannten Aktionen, die ihr kennt, die sind alle immer nur die Spitze des Eisberges. Das ist das, was alle Menschen kennen, aber so eine Kampagne fängt natürlich ganz anders an.
Zugrunde liegend von jeder Kampagne gibt es immer Recherche und Dokumentation. Das heißt wir gehen selber ins Feld und messen nach oder wir beauftragen, Institute und Universitäten Studien anzufertigen für uns. Das ist auch das, worum es natürlich im Datenportal hauptsächlich geht.
Anschließend erarbeiten wir mit diesen Recherchen und Dokumentationen Lösungsvorschläge und konfrontieren die Unternehmen oder die Politik damit. Wenn diese dann wiederum nicht handeln und nicht reagieren, dann passiert das, was viele Menschen mitbekommen. Dann gehen wir in die Öffentlichkeit, machen Aktionen und versuchen damit, die Politikerinnen und die Unternehmen dazu zu bringen, unsere Lösungsvorschläge anzunehmen und zu handeln.
Heute geht es nur um den ersten Schritt, um die Recherche und Dokumentation und die Daten, die wir dort aufnehmen. Das Ganze habe ich, weil wir auf einer GISS-Konferenz uns ein bisschen vorgestellt haben, wie eine Reise zum Datenportal. Das heißt, zuerst blicken wir auf die Landkarte, gucken nach, was gibt es da draußen überhaupt so.
Wir schauen uns die Reiseroute an, gucken nach, wo es überhaupt hingehen soll. Wir gucken nach, welches Verkehrsmittel wir wählen können, welches Software wir nutzen wollen, welche Schlaglöcher, gab es vorhin schon einen interessanten Talk zu, welche Umleitungen es auf dem Weg dahin gibt, was ist mir aufgefallen im Projekt, was würde ich anders machen, was würde ich anderen Menschen empfehlen, die in eine ähnliche Richtung arbeiten wollen.
Und wir schauen uns nach, welches Ziel wir jetzt erreicht haben und wohin die Reise eigentlich im Endeffekt noch weitergehen könnte. Datenportale aus der Zivilgesellschaft, das gibt es da draußen schon. Sowas wie Open Street, das muss ich hier gar nicht erwähnen, Wikipedia, Wikimedia, das sind alles Sachen, die aus der Zivilgesellschaft kommen, aber ich sage mal, aus einer eher IT-affinen Community entstanden sind.
Wenn man jetzt in Richtung Umwelt-NG ausschaut, gibt es da noch nicht so viel draußen. Was noch bekannt ist und erwähnenswert ist, ist die wissenschaftlichen Datenportale, da gibt es unter anderem Zenodo oder auch Panagea, das geht dabei um erdwissenschaftliche Daten,
da gibt es bereits große wissenschaftliche Datenportale. Im Bereich des Staates kennen wir auch alle Transparenzportale oder aber auch die Aggregatoren dazu, sowas wie GovData. Aber auch für die Zivilgesellschaft ist es interessant, Daten zu veröffentlichen. Für die Nutzerinnen ist es eh klar, warum die Daten offen sein sollten, aber auch für die Akteure selbst ist es spannend.
Dazu gab es vor kurzem eine Umfrage von der Bertelsmann Stiftung, die ich hier einmal zeigen will. Da wurden Akteure aus der Zivilgesellschaft gefragt, welchen Mehrwert sie darin sehen, Daten offen darzustellen oder zu veröffentlichen. Hauptsächlich sagen sie, die stärken Transparenz ist uns extrem wichtig.
Genauso wie die vereinfachte Kommunikation mit Externen oder auch Impulse für den Wandel der Organisationskultur. Vieles davon sind auch Punkte, die für uns wichtig waren. Zu den genauen Zielen komme ich gleich nochmal. Jetzt ist die Frage, wie das Ganze umgesetzt wird. Da zitiere ich nochmal hier so eine Tabelle bzw. einen Ausschnitt daraus von
der Bertelsmann Stiftung aus dem Leitfaden für offene Daten aus dem Jahr 2020. Da wird das Ganze in vier Stufen eingeteilt, kein Open Data, Fall 1 Einstieg, Fortgeschritten oder Profis. Greenpeace selbst war bisher eher im Bereich kein Open Data bis zum Einstieg. Das heißt, wir haben die Rohdaten für unsere Studien häufig mit veröffentlicht,
aber sie mussten immer irgendwie in die Tabelle am Ende vom PDF reinpassen. Das heißt, da sieht man schon mal, auf welchem Level sie das bewegt hat. Es war nicht maschinenlesbar und es war nicht so einfach zugänglich und auch sehr dezentral. Und von Karten müssen wir gar nicht sprechen. Die wurden natürlich reingesetzt, aber die Rohdaten dazu waren natürlich nicht vorhanden und lassen sich aus einer Grafik auch extrem schwer extrahieren.
Jetzt haben wir den Sprung gewagt, von kein Open Data bis hin zum, ich sage mal, fortgeschrittenen Profilevel mit einem eigenen Datenportal. Wie wir das Ganze gemacht haben? Wir haben uns versucht, so ein bisschen an nutzerentrenntiertem Design zu orientieren. Das heißt, zunächst haben wir uns eine Vision überlegt.
Was wollen wir überhaupt? Die muss ich jetzt mal so grob ablesen. Unsere Vision war, dass Greenpeace Deutschland Transparenz und Vertrauen in unsere Arbeitsweise schafft und das wissenschaftlich hohe Niveau nach außen transportieren kann und gleichzeitig auch Wissenschaftlerinnen und Journalistinnen ermöglicht, an unseren Kampagnenthemen weiterführende Arbeiten zu ermöglichen.
Mit dieser Vision haben wir uns dann die Zielgruppen überlegt, die wir ansprechen wollen. Das sind, wie gesagt, Wissenschaftlerinnen, Journalistinnen, aber auch die interessierte Öffentlichkeit. Menschen, die Greenpeace interessiert sind oder die dem auch kritisch gegenüberstehen und verstehen wollen, wie wir zu unseren Lösungsvorschlägen kommen. Jetzt haben wir Glück gehabt. Wir haben gerade neue Mitarbeitende gehabt, die quasi aus diesen verschiedenen Bereichen gekommen sind.
Wir haben Wissenschaftlerinnen gehabt und Journalistinnen. Wir konnten sie direkt interviewen, haben uns dann Personas überlegt und haben mit den Personas klassischerweise die Paints und Gains usw. sofort durchgespielt. Und aus diesen verschiedenen Informationen haben wir dann quasi eine Feature-Liste erstellt, was unser Datenportal leisten können sollte.
Wenn wir diese Liste nun fertiggestellt haben, geht es darum, die Softwareauswahl zu treffen. Wie wollen wir unsere Daten veröffentlichen? Da haben wir uns auch ein bisschen umgeschaut, wie andere das machen. Es gibt Organisationen, die ihre Daten direkt bei GitHub veröffentlichen, z.B. das RKI, zusätzlich angebunden an Zenodo.
Dazu gibt es natürlich auch klassische Softwareanbieter, z.B. Sikan, Dikan und neuerdings auch Pivot. Die haben wir uns alle genau angeschaut und haben für uns beschlossen, anhand von der Feature-Liste, die wir quasi hatten, dass wir mit Sikan weitergehen. Das Ganze haben wir nicht selber entwickelt, sondern haben uns an eine Agentur gewandt,
die darauf spezialisiert ist, mit der wir das gemeinsam fortgeführt haben. Der Weg dahin war eigentlich recht straightforward. Wir haben uns einen MVP überlegt, mit dem wir live gehen wollen, ein Minimal Viable Product. Wir wollten quasi so klein wie möglich starten, weil wir nicht genau wissen, wie gut das Ganze ankommt und wir wollen jetzt kein 3-Jahres-Projekt draus machen,
bevor wir überhaupt wissen, wie die Menschen da draußen das finden oder nutzen am Endeffekt. Den MVP-Gedanken würde ich auch immer wieder empfehlen, immer wieder auf den Kopf zu behalten, weil immer wieder Nutzerinnen kommen oder Expertinnen innerhalb von Greenpeace, die gerne bestimmte Features gerne hätten. Das heißt, wir wollten das immer wieder runterbrechen auf das Grund-Baugerüst, was überhaupt nötig ist, um erst mal zu launchen.
Ein klassischer Schritt, der auch meist übersehen wird, ist die Aufarbeitung von vergangenen Veröffentlichungen. Man will natürlich nicht leer starten, mit null Daten setzen. Deswegen ist das doch erstaunlich viel Arbeit. Man muss gucken, was alles besser veröffentlicht worden ist. Man muss die Personen finden, die das damals bearbeitet haben. Die haben das alles auf einem sehr hohen wissenschaftlichen Niveau gemacht.
Das heißt aber nicht, dass es alles perfekte CSV-Dateien sind, die man bekommt, sondern es sind verschiedene Formate dort. Jeder weiß schon mal, wenn das mal Komma, mal Semikolons überriert ist. Wenn das Datumsformat sich so oder so verhält, ist das sehr kompliziert, die alle zu vereinheitlichen bzw. das alles ordentlich zu strukturieren. Da würde ich auch immer sehr viel Zeit in Zukunft mit für einplanen für diesen Schritt.
Und das Ganze ist wohlgemerkt bei den Datensätzen. Ich glaube, wir sind, glaube ich, mit sieben Datensätzen aus der Vergangenheit gestartet, weil wir nicht zu weit in die Historie geschauen wollten, aus Relevanzgründen und auch aus Arbeitsgründen. Und selbst da war es viel Aufwand. Und zu guter Letzt interne Schulungsworkshops. Die Wissenschaftlerinnen müssen geschult werden, welche Formate in Zukunft flich sind,
wie sie quasi grundlegend arbeiten können, damit das Veröffentlichen später einfacher wird. Das heißt, die Templates, die bisher genutzt werden, um zum Beispiel Laborergebnisse auszuwerten, müssen angepasst werden, dass man sie direkt in das Datenportal schieben kann, früh oder später. In der Praxis gibt es natürlich noch weitere Hürden.
Am Anfang sind alle begeistert von unserem Datenportal. Wenn Menschen dann merken, dass es doch mehr Arbeit ist, muss man die Relevanz in der Organisation immer wieder aufs Neue anschubsen, sage ich mal. Das heißt, immer wieder erwähnen, warum es wichtig ist, die Daten zu veröffentlichen und welche Vorteile wir langfristig davon haben. Gleichzeitig müssen Prozesse sichergestellt werden,
um die Datenqualität immer auf einem hohen Niveau zu halten. Das sind Sachen, die mir vorher noch nicht ganz so bekannt waren. Wie wichtig es ist, da immer wieder hinterher zu sein und wie viele Schritte man gehen muss, um quasi alles auf einer Linie zu haben. Das heißt, die Daten im Datenportal müssen einheitlich sein mit unseren Veröffentlichungen, mit den Pressemitteilungen, mit den Studien. Da muss es bestimmt Leute geben, die auf alles einen einheitlichen Blick haben.
Das heißt, intern haben wir so eine Art Evaluationsprozess angestoßen, mit dem alle Mitarbeitenden jetzt arbeiten müssen, bevor sie Daten veröffentlichen können. Und zu guter Letzt natürlich Nutzerinnen informieren. Das heißt, die Zielgruppe ansprechen, Werbung machen im Endeffekt. Das, was ich jetzt hier mache, unser Datenportal vorstellen an Leute, die das interessieren könnte.
Und gleichzeitig aber auch zu anderen NGOs zu gehen, um die zu motivieren, so etwas Ähnliches zu tun. Und das sind auch unsere Aufgaben jetzt für die Zukunft. Das heißt, wir wollen natürlich ab jetzt alle Studien in diesem Datenportal veröffentlichen. Wir sprechen jetzt nicht von einer Größenordnung, wie das die Transparenzportale des Status machen,
wo wir hunderttausende Datensätze haben. Wir werden, glaube ich, nächste Woche zweistellig. Das heißt, das ist alles noch nicht so riesig. Aber von jetzt an wird das kontinuierlich wachsen. Gleichzeitig wollen wir andere NGOs motivieren, das Gleiche zu tun und vielleicht voneinander zu lernen. Das heißt, falls hier jemand ist vom BUND, vom WWF, von anderen Partnerorganisationen,
würde ich mich sehr über einen Austausch freuen, wie wir in Zukunft quasi in die gleiche Richtung arbeiten können oder vielleicht auch gemeinsame Datenportale aufbauen können. Und zu guter Letzt natürlich die Datenqualität verbessern. Das heißt, wir sind auf Feedback von Menschen angewiesen, die die Daten nutzen, von Wissenschaftlerinnen, Journalistinnen, die uns quasi sagen, in welche Richtung wir noch weiter optimieren können.
Und wer das Ganze ausprobieren möchte, der kann das Ganze auf daten.weenpeace.de. Ich freue mich da über jegliches Feedback, sei es um Seekern, Architekturen oder um detaillierte Informationen, welche Datensätze auf welche Art und Weise noch optimiert werden können.
Damit bin ich schon durch und freue mich auf eine rege Fragerunde. Vielen Dank für den Vortrag. Bisher haben wir eine Frage. Und zwar, nutzt ihr Open-Street-Map-Daten?
Tragt ihr in irgendeiner Weise dazu bei? Wir nutzen Open-Street-Map-Daten für Teile unserer Studien. Mir ist eine Studie aus letztem Jahr bekannt, wo Open-Street-Map-Daten genutzt worden sind. Diese wurden aber nicht verbessert, sondern wurden quasi nur als Rohdaten genutzt. In dem Fall ging es, glaube ich, darum, CO2 senken zu berechnen.
Also welchen Impact haben eine Verbreitung von Straßen sozusagen auf den CO2-Gehalt? Dann ist noch die Bitte fixi Hartmann zu grüßen, wer auch immer das ist. Ansonsten Fragen kann man stellen entweder über die QR-Codes hier oder wenn jemand spontan eine hat, können wir auch mit dem Mikro hochkommen.
Also Fragen können gerne über die QR-Codes gestellt werden oder auch einfach melden, wenn jemand noch eine hat. Welche Daten liegen bisher vor? Wir haben versucht, zum Start verschiedene Kampagnengebiete abzulegen.
Das heißt, wir haben da Daten von Labormessungen, zum Beispiel vom Fischsterben in der Oder, was vor, glaube ich, zwei Jahren passiert ist. Wir haben aber auch Messungen, die wir zum Beispiel in Tschernobyl gemacht haben, Radioaktivitätsmessungen von Drohnen heraus. Also wir haben verschiedene Daten, die dort vorhanden sind, je nach Kampagnen-Schwerpunkt.
Und beschreibt ihr eure Daten mit Metadaten iso-konform? Wir versuchen uns an D-Card-AP zu halten, haben nicht das ganze Spektrum davon abgebildet, aber versuchen ein großer davon abzubilden, um es quasi auch möglich zu machen,
dass die Daten gehavestet werden können. Das heißt, die Daten hier findet man zum Beispiel auch bei der Google Dataset Search. Habt ihr auch Probleme mit personenbezogenen Daten oder Betriebsgeheimnissen? Wichtiges Thema genau, natürlich werden uns manchmal auch Informationen zugespielt. Da ist der Quellenschutz dann enorm wichtig. Das heißt, wir veröffentlichen nicht immer alle Daten,
sondern wir gucken natürlich vorher genau, was da drin steht und wer dadurch gefährdet werden könnte. Nutzt ihr bei C-Kan-Tex und räumlich Verortung der Daten? Genau, das geht ein bisschen in die Richtung des MVPs. Wir wollten so klein wie möglich starten.
Wir hätten natürlich gerne so eine Art Geo-Suche drin gehabt, wo man sagen kann, so eine bounding-Box einzeichnen kann, und davon hätte ich gerne meine Daten. Das Ganze haben wir erstmal nicht umgesetzt, haben uns aber schon gedacht, dass wir das in Zukunft vielleicht machen wollen. Das heißt, wir haben GeoJasins zu einigen Datensätzen hinterlegt, in welchem Bereich sie sich befinden, könnten das sozusagen in Zukunft weiter nutzen,
falls das die Frage beantwortet. Gibt es dann sonst noch Fragen im Raum? Dann vielen Dank für den Vortrag. Sehr gerne.