Open Data - und was hat das mit mir zu tun?
This is a modal window.
The media could not be loaded, either because the server or network failed or because the format is not supported.
Formal Metadata
Title |
| |
Title of Series | ||
Number of Parts | 132 | |
Author | ||
License | CC Attribution - ShareAlike 3.0 Germany: You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor and the work or content is shared also in adapted form only under the conditions of this | |
Identifiers | 10.5446/33504 (DOI) | |
Publisher | ||
Release Date | ||
Language |
Content Metadata
Subject Area | ||
Genre | ||
Abstract |
|
00:00
WINDOWS <Programm>XMLLecture/Conference
00:31
CodeMeeting/InterviewLecture/Conference
00:59
Local ringCASBeta functionPresentation of a groupMeeting/Interview
02:07
IP addressComputer animation
02:36
Raw image formatLoginRow (database)Open setSoftwareRaw image formatDatenformatBeta functionXMLComputer animation
04:41
Web serviceService (economics)Grand Unified TheoryMobile appPlane (geometry)Row (database)Business modelEnergie
05:45
Plane (geometry)Eigenvalues and eigenvectors
06:14
EnergieHacker (term)Computer animationDiagram
06:51
World Wide WebRow (database)GeodesicDigitales GeländemodellBeta functionHöhe
07:20
Hardware-in-the-loop simulationPHPFINANZ <Programm>Maschinelle Lesbarkeit
07:48
Plane (geometry)Coordinate systemOpen setRoute of administrationPlane (geometry)Beta functionComputer animation
08:52
Workstation <Musikinstrument>RoutingRoute of administrationBeta functionLecture/ConferenceComputer animation
09:52
String (computer science)Staff (military)Wiener filterRow (database)Reading (process)XMLUMLComputer animation
10:19
Mono-FrameworkFilter <Informatik>DepictionComputer animation
10:46
Milan <Programmiersprache>MAX <Programm>WEBWireless LANTED <Datenbank>String (computer science)Parameter (computer programming)File formatSmart cardRow (database)Physical quantityGoogleService (economics)Condition numberMobile appXML
12:01
Row (database)EstimationSpur <Datentechnik>Beta functionComputer animation
13:08
Decision theoryRow (database)Series (mathematics)NumberQuoteXMLUML
13:34
POCOHTTPGenderIndependence (probability theory)Web serviceSoftware developerParameter (computer programming)WebsiteInformationStress (mechanics)FactorizationFilter <Informatik>Standard deviationWeb portalLevel (video gaming)Office <Programm>
14:44
PDF <Dateiformat>State of matterComputer animation
15:49
Parameter (computer programming)EmoticonMeeting/Interview
16:57
Route of administrationAbgeschlossenheit <Mathematik>Decision theoryWeb serviceBeta functionComputer animation
18:15
Grand Unified TheoryComputer animation
18:38
Parameter (computer programming)Computer animation
19:11
Parameter (computer programming)Kritischer ZustandTable
20:16
Computer animation
20:50
Lecture/ConferenceMeeting/Interview
22:08
Expert systemXMLUMLComputer animation
23:18
NeWSFocus (optics)Row (database)Parameter (computer programming)Computer animation
24:09
EmailRow (database)PDF <Dateiformat>Computer animation
24:34
Row (database)Zusammenhang <Mathematik>StatistikerDecision theoryAbstrakte ZahlSoftwareMeeting/Interview
25:38
AudiovisualisierungFacebookRoute of administrationRow (database)Beta functionComputer animation
26:46
Mobile appOpen setCodeLecture/ConferenceMeeting/InterviewXMLUML
27:43
Chain ruleInformationComputing platformGoogleComputer networkWeb pageElectronic mailing listMeeting/InterviewComputer animation
28:53
World Wide WebWINDOWS <Programm>TwitterComputer animationXML
Transcript: German(auto-generated)
00:13
So, die Pause ist vorbei. In der letzten Stunde haben wir erfahren, was Open Data, Open Government ist, was es
00:21
nicht ist und dass es durchaus sinnvoll ist, einen kritischen Blick darauf zu haben. In der nächsten Dreiviertelstunde erfahren wir, was Open Data so interessant für mich, für den Bürger macht. Ihr kennt sicher alle die Seite fragt den Staat und die Entwickler unter euch kennen sicher auch das Projekt Stadtland Code. Gleich kommen die beiden Projektleiter, die beiden Köpfe hinter diesen Projekten auf
00:43
die Bühne. Julia Kläuber und Stefan Wehrmaier von der OKFN. Ein herzliches Applaus für die beiden und viel Spaß. Ja, danke für die nette Begrüßung. Wir sind Stefan und Julia, arbeiten für die Open Knowledge Foundation, wie das
01:01
bereits angekündigt wurde. In Deutschland ist es ein gemeinnütziger Verein, den es seit zwei Jahren gibt und der sich für freies Wissen und Open Data einsetzt. Und für die heutige Präsentation haben wir uns der Herausforderung gestellt, das Thema so aufzuarbeiten, dass auch Menschen, die nicht aus Berufswegen oder aus großem Interesse mit Open Data zu tun haben, das verstehen und das es
01:24
etwas greifbarer wird. Man sieht auch schon sehr einfache Grafiken und genau, denn wir sind einfach der Überzeugung, das Thema Open Data ist alles andere als alltags fern und abstrakt. Ganz im Gegenteil, es hat sehr viel mit unserer Lebensumwelt und unserem Alltag zu tun. Und ja, das wollen wir unter Beweis stellen heute mit ganz vielen
01:44
Beispielen und unter anderem auch wird sich viel um den lokalen Kontext und um sehr konkrete Beispiele und Use Cases drehen. Die Präsentation ist sehr beispiellastig und wir kommen aber trotzdem nicht drum herum, so ein bisschen Theorie einzustreuen und die wichtigsten
02:03
Fragen zu Open Data im Vorfeld zu behandeln. Und zwar die erste Frage, von welchen Daten sprechen wir eigentlich? Wir sprechen von staatlichen Daten, also meist von staatlichen Daten, Daten, die von staatlichen Institutionen, von Behörden, von staatlich geförderter
02:20
Forschung gesammelt und erhoben werden und es sind wirklich relativ viele. Es geht explizit nicht um persönliche Daten, es geht auch nicht um sicherheitsrelevante Daten und Daten, die dem Datenschutz unterliegen. Hier ist eine ganz klare Abgrenzung zu treffen. Dann vielleicht noch, weil man es auch eigentlich nicht oft genug sagen kann, was bedeutet eigentlich dieses Open?
02:41
Was bedeutet offen? Wann sind Daten offen? Und hier gibt es ein paar Stichpunkte. Daten sind dann offen, wenn sie unter offenen Lizenzen stehen. Das bedeutet, jeder darf Daten nutzen und sie weiterverwenden, maximal mit Namensnennung und share alike. Und welche Lizenzen offen sind, kann man nachsehen
03:03
auf der Seite OpenDefinition.org. Es geht hier stark um Interoperabilität, ein sehr kompliziertes Wort, das eigentlich nur beschreibt, dass man unterschiedliche Datensätze miteinander kombinieren möchte, weil man möchte nicht nur innerhalb Deutschlands Daten miteinander kombinieren, sondern auch international.
03:21
Deswegen ist es einfach wichtig, dass Lizenzen verwendet werden, die international gebräuchlichsten Creative Commons Lizenzen würden darunter fallen oder die Open Database License. Dann als zweiten Punkt offene Datenformate. Wir wollen keine proprietieren Datenformate, wo man sich erst für zigtausende Euro eine Software kaufen muss, um die zu entschlüsseln,
03:42
sondern es geht darum, die Daten mit jedem Programm auch mit offener Software öffnen zu können. Dann maschinenlesbare Rohdaten. Hier ist ein wundervolles Stake, das daran erinnert. Wir wollen wirklich die rohen Daten, so wie sie erhoben wurden, ohne dass sie zuerst durch einen Fleischwolf gedreht und verändert wurden.
04:02
Und maschinenlesbar. Hier steht das PDF dafür. Keine PDFs, bitte, weil PDFs sind ziemlich schwer. Man muss sich die Daten erst rausziehen. Es ist schon mit dem Text verpackt in ein Dokument. Das heißt, wirklich abstrakte Zahlentabellen sind das Beste bei Open Data. Dann gibt es noch zwei weitere Punkte.
04:21
Diskriminierungsfrei. Man soll sich nicht einloggen müssen. Man soll nicht sagen müssen, für was man die Daten verwenden möchte und eine proaktive und zeitnahe zur Verfügung Stellung. Das heißt, man muss nicht jedes Jahr wieder aufs Neue fragen. Gebt uns doch den aktuellen Datensatz, sondern im Idealfall ist es ein Selbstläufer. Genau, das war auch schon fast der Theorie Teil.
04:43
Hier vielleicht auch noch. Warum brauchen wir offene Daten? Was bringen uns offene Daten? Hier gibt es drei Gründe. Zum einen politische Entscheidungen können besser nachvollzogen. Wenn beispielsweise Daten aus Studien, die Politiker für sich erstellen lassen, offen und für alle verfügbar und einsichtig sind, einsehbar sind, komplexe Sachverhalte besser verstehen.
05:05
Hier zum Beispiel die Energiewende, auf welche Daten bezieht man sich da? Und als letzter Punkt Innovation fördern. Hier kann man gutes Beispiel Nahverkehrs Daten bringen. Bei Innovation geht es darum, wenn Daten offen sind, dann bauen bestimmte Unternehmen
05:21
ihre Services und Dienstleistungen darauf auf. Beispielsweise Nahverkehrs Daten. Sie bieten weitere Nahverkehrs Apps an und bauen ihr Geschäftsmodell drauf auf. Und das war jetzt auch schon der kurze Theorie Teil. Wir kommen zu den Beispielen. Und Stefan erklärt euch mal oder zoomt mal kurz rein von außen in den detaillierteren Bereich.
05:41
Genau, fangen wir auf der globalen Ebene an. Was wäre ein Beispiel für einen globalen Datensatz? Zum Beispiel CO2 Emissionen, um den globalen Klimawandel zu verstehen. Um die globale Erwärmung besser zu verstehen, braucht man CO2-Daten. Die werden in jedem Land erhoben und sollten offen zur Verfügung stehen. Allerdings gibt es da momentan große Probleme.
06:01
Die kommen nur sehr verspätet und gegebenenfalls auch mit einigen Datenproblemen daher. Und da ist es momentan etwas komplizierter, diese CO2-Emissionen auf globaler Ebene zu verstehen. Zoomen wir noch ein Stückchen weiter an Europa, der Energieverbrauch. Den brauchen wir ja auch. Wir haben hier selber die Energiewende in Deutschland. Was bedeutet das im europäischen Kontext?
06:23
Da wurde auf einem Open Knowledge Foundation Hack Day eine schöne Grafik gemacht mit Daten von Eurostat, also dem Europäischen Statistikamt letztlich. Und die zeigt z.B. wie der Energiemix in den Ländern funktioniert zwischen erneuerbaren Energien und den anderen. Und da kommen spannende Sachen raus, wie in Deutschland.
06:41
Wir reden jetzt sehr viel von erneuerbaren Energien, aber es gibt Länder in Europa, die funktionieren schon komplett. 100 % auf erneuerbare Energie. Da müssen wir noch ein Stückchen gehen. Zoomen wir noch ein Stückchen weiter ran. Deutschland hat letztendlich seine Geodaten veröffentlicht. Es gab letztendlich die Änderung des Geodatenzugangsgesetzes.
07:01
Und das hat es möglich gemacht, für das Bundesamt für Kartografie und Geodesie jetzt endlich einige Datensätze herauszugeben und nicht nur zu verkaufen. Für den Datensatz z.B. das digitale Geländemodell, also die Höhen in Deutschland hat man vor Kurzem noch Geld bezahlen müssen. Die sind jetzt als Open Data verfügbar.
07:20
Dann hier noch ein Stückchen weiter dran. Berlin, der Haushalt der Berliner Senat für Finanzen hat künstlich seinen Haushalt in maschinenlesbarer Form online gestellt. Und wir als Foundation haben daraus dann eine Haushaltsvisualisierung gemacht. Gerade in Berlin ist der Haushalt vielleicht ein kritisches Thema. Eigentlich haben wir ja nicht so viel Geld, habe ich gehört. Aber das Geld muss natürlich trotzdem irgendwo rein fließen.
07:42
Und hier sehen wir halt ganz schön, kann auch der Bürger verstehen, wo das Geld rein fließt. Aber was hat das Ganze jetzt wirklich mit mir zu tun? Die Daten waren ja immer noch sehr abstrakt. Das war immer noch eine sehr, sehr hohe Ebene. Die hat eigentlich mit dem einzelnen Bürger noch nichts zu tun. Aber wie viele von euch sind denn heute mit den öffentlichen Verkehrsmitteln hier angereist?
08:01
Show of Hands. Ja, das sind doch schon einige. Und für diese Anreise braucht man eigentlich keine Open Data. Das hat auch bisher ganz gut geklappt. Dieses von A nach B, sag mir bitte. Also ich brauche diese Fahrplanauskunft. Die hat auch ohne Open Data funktioniert. Trotzdem gibt es einige Anwendungen, die man bauen kann, wenn man Open Data hat im Nahverkehrsbereich,
08:22
wenn man Fahrpläne hat, wenn man Stationskoordinaten hat, wenn man die Echtzeitdaten hätte, wenn man Lagepläne hätte. Und es ist uns gelungen, als Open Noise Foundation, als Open Data Community mit dem VWB zusammenzuarbeiten und den VWB zu überzeugen, diese Daten unter einer offenen Lizenz zur Verfügung zu stellen. Zumindest die Fahrplandaten und Stationskoordinaten.
08:42
An allem anderen wird noch gearbeitet, aber das auf einem guten Weg. Und was bedeutet das letztlich? Jetzt sind diese Fahrpläne, ja, da kann man auch mal applaudieren. Der VWB ist auch der erste Verkehrsverbund in Deutschland, der seine Daten geöffnet hat. Und dazu gibt es auch nach diesem Talk eins später noch einen Panel dazu.
09:00
Was machen diese Daten möglich? Zum Beispiel eine Erreichbarkeitskarte. Das ist nicht mit A nach B Routing möglich. Da braucht man den gesamten Fahrplan. Das hier, man erkennt es kaum, ist in der Mitte die Station. Zehn Minuten von der Station kann ich das erreichen mit den öffentlichen Verkehrsmitteln. Eine sehr schöne Anwendung. Oder auch Nahverkehrs Multimodales Routing.
09:20
Ich möchte, es gibt ja noch ein paar mehr Verkehrsmittel, zum Beispiel Carsharing oder ein Taxi oder Fahrrad. Und die Anwendung Muvl von Daimler zum Beispiel ermöglicht Multimodales Routing. Aber hier wird auch gerade Open Data wichtiger, weil wie man sieht, hat Muvl hier bei Fahrrad gar nichts ausgespuckt, als wir es das letzte Mal gebraucht haben. Hat Daimler da vielleicht eine Agenda?
09:40
Man weiß es nicht genau. Jedenfalls braucht man Open Data, damit auch andere Player, nicht nur so große wie Daimler, da mitmischen können. Vielleicht hat man Fahrräder rausgelassen, weil es zu gefährlich ist. Julia? Genau. Und wir kommen auch schon zum nächsten Beispiel. Im Verkehr gibt es noch weitere interessante Daten, zum Beispiel Fahrradunfälle jetzt im Frühling. Man steigt wieder aufs Rad. So sehen diese Datensätze momentan aus.
10:01
So werden sie von der Polizeidirektion rausgegeben, einmal im Jahr veröffentlicht. Hier sehen wir das PDF von 2011 und die unterschiedlichen Straßen abgekürzt mit der Anzahl der Unfälle. Wenig aussagekräftig. Man kann sich das jetzt durchlesen, Notizen machen. Zum Glück hat Michael Hertz das für uns gemacht und aufbereitet.
10:21
Die Daten sich rausgesucht und mal visualisiert. Wo in Berlin finden, wo in Berlin kracht es denn mit Fahrradfahrern? Und das ist jetzt mal eine Darstellung. Man sieht hier, man hat Filter an der Seite, alle Unfälle. Ein sehr praxisnahes Beispiel, wenn man Fahrradfahrer ist und eine Frage, die man sich vielleicht auch stellt. Ist, welche Kreuzungen sind denn die gefährlichsten?
10:43
Hier in Berlin zum Beispiel. Da habe ich jetzt den zweiten Filter angewendet und zwar häufigste Unfälle und man sieht, es gibt drei Unfall Schwerpunkte, die jetzt nicht allzu überraschend sind. Es ist Moritzplatz, Kortbusser Tor und Oberbaumbrücke, aber dennoch ziemlich aufschlussreich, weil dann mache ich vielleicht ein Wogen um diese Orte,
11:01
wenn ich weiß, dass es da häufig Unfälle gibt. Und Unfall, Ort und Anzahl sind natürlich nur zwei Parameter. Anders funktioniert das momentan schon in Chicago, wo die Datensätze wirklich in gut lesbaren Formaten zur Verfügung stehen. Da kann man dann noch mal detaillierter sehen. Was ist eigentlich passiert? Wie waren die Wetterkonditionen oder hat es geregnet?
11:23
War die Straße trocken? War es bei Nacht? Vielleicht passieren ja in Berlin am Kortbusser Tor auch nur Nachtsunfälle, wenn die Fahrer alle betrunken sind. Man weiß es nicht. Auf jeden Fall sieht man hier schon ganz gut. Je mehr Parameter man hat, desto besser kann man Daten filtern, desto besser kann man sich neue Erkenntnisse daraus ziehen.
11:40
Fahrradunfälle finde ich super spannend als Bürger, als Fahrradfahrer. Und die Hoffnung ist natürlich nicht, dass man in Zukunft eine App hat, die man sich installieren muss, sondern dass wenn diese Daten frei verfügbar sind, dass die überall integriert werden. Also dass beispielsweise auch die großen Kartendienstleister Google Maps die Fahrradunfalldaten integriert und man die sich angucken kann.
12:00
Im Verkehrsbereich gibt es noch weitere interessante Datensätze zu Staumeldungen, Lärmmessungen, CO2-Ausstoß. Und jetzt möchte ich noch ein Beispiel zeigen, was, wenn diese Datensätze noch nicht verfügbar sind. Viele Orte sind zum Beispiel die Daten zu Lärmmessungen noch nicht verfügbar. Hier ist ein ganz interessantes Beispiel von einem Hackday.
12:23
Es heißt Wohnen ohne Lärm. Und die haben sich so eine kleine, ja, die haben so ein bisschen gehackt und sich die Open Street Daten genommen, wollten rausfinden, welche Straßen sind die lautest und haben einfach geguckt, wie viele Spuren haben die Straßen? Was ist die Geschwindigkeitsbegrenzung und haben dann Schätzungen gemacht?
12:41
Und die Schätzungen sieht man eben hier die ganz dicken Linien sind die sehr stark belasteten Straßen. Es ist wie gesagt nur eine Beta Version, aber mal ein Beispiel dafür, wenn man die Daten nicht bekommt, dann kann man auch kreative andere Wege gehen, bis die Daten dann freiliegen. Und Stichwort Lärm, ein Thema oder bringt uns zum nächsten öffentlichen
13:01
Bereich, in dem auch sehr viele Daten erhoben und gesammelt werden und zu dem noch viel zu wenig offen, für den noch viel zu wenig offen liegt. Und zwar geht es um Schulen. Betrifft vielleicht nicht jeden hier im Raum, aber zu Schulen gibt es interessante Daten wie Standorte von Schulen, Schülerlehrerzahlen, wie viele Schüler kommen auf einen Lehrer, Abbrecherquoten,
13:23
Gymnasialempfehlungen, Abiturnoten. Also da gibt es eine ganze Reihe an Datensätzen. Und es ist natürlich interessant, wenn man sich fragt, auf welche Schule soll mein Kind gehen und hilft einem dabei, mündiger Entscheidungen zu treffen. Und vor so einer Entscheidung stand auch ein Ehepaar in England. Die wollten umziehen. Und ein wichtiger oder ein essenzieller Faktor
13:42
für diesen Umzug war eben, befindet sich eine gute Schule für unsere Kinder in der Nähe. Und die haben sich monatelang, schreiben sie auf ihrer Website lowgrading.com, durch unterschiedlichste Portale gesucht. Auf denen es Informationen gab, wo man nicht wusste, woher kommen die Daten.
14:00
Finden wir da wirklich alle Schulen. Also teilweise waren die Daten sehr mangelhaft. Und am Ende hat sich der Mann bei dem Ehepaar, der Softwareentwickler war, zufälligerweise überlegt, okay, er baut jetzt seine eigene, seine eigene Map mit den Schulen. Und zwar hat er die Ergebnisse von Ofstedt. Das ist ein Office for Standards in Education and Children Service, eine staatliche Einrichtung in Großbritannien, die eben Schulen überprüft
14:23
und diese Daten auch veröffentlicht. Die hatte herangezogen, die auf eine Karte gemapped. Und man sieht jetzt hier, man hat hier unten, es ist leider ein bisschen abgeschnitten, die unterschiedlichen Parameter. Die Gelben wären die ganz Outstanding Schulen. Zwei wäre gut. Man kann dann auch noch die Schule anklicken und gucken. Okay, weitere Zusatzinformationen filtern.
14:43
In Berlin sieht das momentan noch so aus. Man muss sich wirklich von Schule zu Schule klicken und sich alles durchlesen. Genau, die Bundesländer hüten teilweise ihre Wiederholerquoten, ihre Wiederholerquoten, ihre Abidurchschnittnoten, ihre Leistungsvergleiche, den Unterrichtsausfall.
15:01
Ganz schwieriges Thema wie Staatsgeheimnisse. Es gab aber vor kurzem Anfang des Jahres eine Klage hier in Berlin. Spickmich.de, ich weiß nicht, ob ihr die Seite kennt, da können Kinder ihre Lehrer raten, hat die Senatsverwaltung verklagt und auf Herausgabe der Daten, weil eine Begründung, warum diese Daten nicht rausgegeben wurden, war, wie so oft Fehlinterpretation.
15:24
Man würde die Brennpunktschulen weiter diskriminieren und den Druck auf die Lehrer erhöhen. Und es wurde dann aber es gab eine Einigung. Also die Daten werden jetzt veröffentlicht in oder es ist gerade der Prozess am Laufen. Und hier möchte ich vielleicht auch noch darauf eingehen.
15:40
Natürlich kann man so diese Nachteile, diese negative Seite nicht ganz außen vor lassen. Natürlich, wenn man veröffentlicht, welche Schule ist die Top, welches sind die zehn Top-Schulen, dann wird es einen verstärkten Run drauf geben. Und wahrscheinlich werden auch die schlechten Schulen noch schlechter. Ich denke, dass eben die positiven Argumente einfach oft überwiegen bei Transparenz. Denn Eltern haben Fakten in der Hand und können auf Basis dieser Fakten
16:03
wirklich Forderungen an die Politik stellen. Man kann Wissenschaftler oder Kandidaten analysieren und herausfinden, warum ist denn diese Schule so schlecht? Was sind da die Einflüsse? Was führt dazu? Ich denke, Transparenz hat einfach immer noch mehr, noch viel mehr positivere Argumente als nicht transparent zu sein
16:21
und sich die Daten einfach verschlossen zu halten. Genau. Wenn ihr heute Abend vielleicht essen geht in einem Restaurant, dann hofft ihr natürlich, dass ihr da nicht in der Küche sich so was befindet. Das wäre besser. Dafür gibt es auch Inspektoren auch in Berlin.
16:42
Da gibt es glaube ich 82. Das kommt dann ungefähr auf 82 auf 52.000 Gastronomiebetriebe. Und das funktioniert nicht ganz. Aber es gab kurze Zeit mal hier in Berlin Daten zu diesem Thema. Die wurden online gestellt. Dieses sogenannte Smiley System. Das ist jetzt durch eine Änderung des Verbraucherinformationsgesetzes
17:00
wieder verschwunden. Jedenfalls konnte ich nichts mehr finden. Diese Restaurant Inspektionsdaten sind natürlich aber ganz interessant, denn Open Data kann helfen, die Hygiene zu verbessern. Und nicht nur das, sondern es gab auch eine Studie in Los Angeles, die hat gezeigt, dass wenn so etwas als Open Data vorhanden ist,
17:20
gibt es tatsächlich weniger Leute, die mit Lebensmittelinfektionen in Krankenhäuser eingeliefert werden. Das heißt, wenn die Daten verfügbar sind, dann werden sie von den Leuten auch genutzt, um bessere Entscheidungen zu treffen. Außerdem gibt es gerade in San Francisco eine Initiative, die diese Daten in einem Standardformat verpackt und anbietet, sodass Anwendungen wie zum Beispiel Yelp oder hier in Deutschland QIPE
17:42
so etwas integrieren können, um es direkt in einen Restaurantführer einen digitalen Restaurantführer einzubinden. Das heißt, ich kann mir nicht nur angucken, wie gut hast du den Leuten da geschmeckt, wie ist das Rating, sondern tatsächlich auch wie er hat es bei der letzten Lebensmittelinspektion abgeschlossen. Das ist natürlich auch mal ein Problem. Wenn man Lebensmittelinspektion online stellt, brandmarkt man einen Ort
18:01
für immer vielleicht, dass er vielleicht Hygieneprobleme hat. Wie wird man sowas wieder los? Eine große Frage. Aber das kann halt auch kein Grund sein, solche Daten nicht online zu stellen. Und hier ist noch ein Beispiel von der New York Times. Die hat diese Restaurantinspektion auch auf eine Karte getan,
18:21
journalistisch aufbereitet. Man kann jetzt hier gucken. Die Blauen sind alle, die ein sehr gutes Rating haben. Aber es gibt auch einige, die einen orangenen oder einen roten Punkt auf der Karte haben. Und da ist man besser nicht. Wenn man da ist, dann landet man wahrscheinlich eher im Krankenhaus. Gibt es da gute Krankenhäuser? Ja, hoffentlich. Und das ist auch schon unser nächstes Thema
18:40
Gesundheit und Krankenhäuser. Hier gibt es auch unterschiedliche Parameter, nach denen man die Qualität messen kann, zum Beispiel wie in Großbritannien seit 2005 die Überlebensraten von Patienten nach Herzoperationen. Die hat man da veröffentlicht. Seitdem hat sich die Lage auch verbessert. Und weil eben der Konkurrenzdruck unter den Kliniken steigt.
19:00
Patienten können transparent sehen, OK, wo wird gepfuscht? Wo läuft nicht alles so, wie es sein sollte? Es erhöht den Leistungsdruck auf die Kliniken und dadurch verbessert sich natürlich einiges. In New York kann man das auch sehen. Das sieht es so aus. 2008 bis 2010 eine Zusammenfassung der Bypass-Certiories. Man sieht hier nach Krankenhäusern sortiert die Fälle, die Todesfälle,
19:24
dann die Todesraten und ganz wichtig und interessant, weil in UK war dann auch so ein Gerücht oder Glaube, so wenn man die Krankenhäuser jetzt nach den Überlebensraten der Herzoperation misst, dann könnte das ja dazu führen, dass Patienten in kritischem Zustand gar nicht mehr
19:43
auf dem Operationstisch landen oder dass sich die Krankenhäuser, die gegenseitig zuschieben, weil sie eben Angst haben, dass ihre Raten schlechter werden könnten. Deswegen ist diese letzte Spalte ganz wichtig, wo es so um risk adjusted mortality, also wo es schon dieser Risikofaktor, wo schon mit eingerechnet ist, in welchem Zustand
20:01
ist der Patient angekommen? Und hier sieht man auch ganz gut, hier ist es wichtig für jemanden, der die Daten weiter verwenden möchte, dass der weiß, wie ist man zu diesen risk adjusted Werten gekommen? Also welche Parameter haben damit reingespielt? Und ein weiterer Parameter anhand von dem man Krankenhäuser oder die Qualität von Krankenhäusern
20:22
raten kann, sind Daten zu Infektionen und Hygiene, wird auch veröffentlicht in anderen Ländern. Und in Deutschland gab es letztes Jahr dazu eine Empfehlung der Informationsfreiheitsbeauftragten und zwar empfehlen, die die Daten für mehr Transparenz für die Patienten zu sorgen und einfach Daten
20:41
zu Hygienestandards und zu Infektionen, die im Krankenhaus passieren, herauszugeben. Man erinnert sich vielleicht letztes Jahr. Es gibt immer wieder mal Fälle in den Medien, wo eben über diese Infektionen oft auch im Säuglingsbereich berichtet wird. Das heißt, es wäre durchaus interessant, mal zu sehen, welche Krankenhäuser sind die schwarzen Schafe?
21:01
Und ja, und wie kann man das vielleicht ändern in den Krankenhäusern? Genau. Aber zum Glück muss man nicht immer ins Krankenhaus, wenn man krank ist, doch auch im Bereich Medikamente. Da gibt es gewisse Gefahren, die durch Open Data vielleicht ausgemerzt werden können. Arzneimittel werden in Deutschland und auf der EU zugelassen. Das finde ich auch ganz gut. Nicht, dass die Pharma-Branche hier alles Mögliche verkaufen kann.
21:22
Leider werden aber zu dieser Zulassung nehmen die Pharma-Branchen Studien, die erstellen sie selbst und geben sie dann den staatlichen Stellen. Und die können anhand dieser Studien erkennen, ob das Arzneimittel wirksam ist, ob es daneben Wirkung gibt, die vielleicht zu viel sind.
21:41
Und lassen sie dieses Arzneimittel aufgrund dieser Studien zu. Allerdings sind diese Studien meist nicht öffentlich. Und das führt dann dazu, dass zum Beispiel bei der Grippewelle 2008 2009 Tami Flu, ein Medikament gegen Grippe, zu Haufen von Deutschland gekauft wurde und auch von vielen anderen Ländern, wo aber Expertengruppen, die unabhängige Studien selbst
22:01
dazu angefärktet haben, meinen, dass Tami Flu nicht so wirksam ist, wie behauptet. Und da müssen wir uns natürlich die Frage stellen, ob unsere Arzneimittel tatsächlich insgesamt so gut funktionieren, wie behauptet. Und warum da so wenig Transparenz herrscht. Eigentlich sollte jedes Medikament, das auf deutschen und europäischen Markts zugelassen wird. Die Studien, die im Medikament gehören, diese müssen öffentlich sein,
22:24
damit unabhängige Experten beurteilen können, ob die Wirksamkeit so gegeben ist. Nächstes ganz prominentes Beispiel Kriminalität. Wir haben vielleicht eine ganz lustige Geschichte. Wir machen eine Hekti mit Kindern im Herbst zu offenen Daten. Und wenn man Kinder fragt, welche Daten wollt ihr denn, dann sind die immer so die Kriminalitätsdaten.
22:42
Wir wollen sehen, was in unserer Nachbarschaft passiert. Und so ist es auch in ganz vielen Umfragen zu Daten setzen. Wenn man die Bevölkerung fragt, was interessiert euch Sex und Crime? Wir spielen auch da scheinbar eine große Rolle. Und ja, in vielen Ländern sind diese Daten verfügbar. Man kennt es hier vielleicht vielerorts. Gibt es Polizeiticker, wo man gucken kann, OK, was ist passiert?
23:02
Die Daten sind leider noch nicht als offene Daten verfügbar, weil das Argument dagegen unter anderem auch ist, dass es zu einer Fehlinterpretation oder dass es zu Fehlinterpretationen kommen könnte und dass Angst und Panikmache einfach durch die Daten noch verstärkt wird. Und am Wochenende habe ich ein ganz nettes Zitat gelesen, das jetzt vielleicht nicht sofort in den Kontext passt,
23:22
aber ich fand es eigentlich ganz gut. Und zwar News is always about the exception. It tells you how the world doesn't work. Und ich denke mir genau um das geht es eigentlich bei Kriminalitätsdaten. Wenn man dann wirklich mal sieht, wenn man diesen ganzen Überblick hat, was passiert eigentlich, dann relativiert sich vieles auch. Das ist jetzt meine persönliche These. Aber ja, also ich denke, das könnte durchaus der Fall sein,
23:42
dass man nicht nur die Einzelfälle aus den Medien mitbekommt, sondern dass man wirklich sieht, so viel passiert doch eigentlich gar nicht. Wir leben doch eigentlich ganz gut friedlich zusammen. Und ja, wenn man eben diese Kriminalitätsdaten hätte, könnten auch Forscher analysieren. Warum gibt es Brennpunkte in bestimmten Bereichen der Stadt?
24:01
Was sind weitere Parameter? Also wirklich interessant wird es bei Open Data oft erst dann, wenn man unterschiedliche Datensätze kombiniert. Und ja, in Zukunft könnte das so aussehen in Deutschland. So sieht es in Großbritannien aus. Man sucht auf der UK Seite nach Crime Data und bekommt dann eine ganze Liste hier oben als PDF und drunter aber lauter CSV Datensätze.
24:21
So schön könnte das in Zukunft aussehen. Und jetzt sind wir auch schon fast bei dem Ende unserer Präsentation. Und ja, ich hoffe, die Beispiele zeigen, dass es einfach ganz viele Daten rund um unseren Alltag und unsere Lebensumgebung gibt, die uns in den unterschiedlichsten Bereichen helfen können, unseren Alltag zu vereinfachen, komplexe Zusammenhänge besser zu verstehen und bessere Entscheidungen zu treffen,
24:43
also einfach mündigere Entscheidungen zu treffen. Aber jetzt nach den ganzen Beispielen darf man natürlich nicht vergessen. Daten sind abstrakte Zahlen und die Tatsache, dass Daten frei verfügbar sind und das Open Data durchgesetzt ist, bedeutet nicht zwangsläufig, dass alles gleich besser wird.
25:00
Denn es braucht zu Leute wie zum Beispiel Stefan Software Entwickler, die uns ja die als Vermittler dienen und die diese Daten aufbereiten. Und natürlich braucht es auch Leute, die wissen, wie man mit Daten umgeht. Denn ganz oft sind es einfach sehr viele Prophecies. Man wirft zwei Datensätze zusammen und erwartet eine Lösung und die kommt dann natürlich auch raus, wenn man nur lang genug dran rumdreht.
25:22
Deswegen zeigt uns Stefan nochmal, auf was es noch ankommt bei offenen Daten, wenn sie mal offens sind. Data, which is not understood, has no value, sagte Hans Rosling, der Promi Statistiker und Experte für bewegte Bubble Diagramme. Und was er damit meint ist, wir haben da zwar Daten, aber wenn sie niemand versteht, was bringen sie?
25:42
Warum erheben wir sie überhaupt, wenn sie niemand nutzt? Und wir erheben sehr viele Daten. Daten brauchen Vermittler und das können Journalisten sein, die daraus Geschichten erzählen aus diesen Daten heraus. Das können Wissenschaftler sein, die Erklärungen in diesen Daten finden. Das können Entwickler sein, die Anwendungen mit diesen Daten bauen oder Gestalter, die Visualisierung erschaffen,
26:01
um damit unseren Alltag besser zu erklären. Aber die braucht es tatsächlich und das muss man dann auch so messen. Ich habe zum Beispiel schon öfters gehört. Ja, wir haben jetzt hier so ein Datenportal, aber die Besucherzahlen sind so gering. Offenbar war die Hoffnung, dass das das nächste Facebook wird. Diese Hoffnung ist aber leider falsch.
26:22
Denn die Reichweite eines Open Data Portals kann man halt nicht mit Besuchen messen. Open Data darf denn auch keine PR-Kampagne sein. Es geht halt um die Vermittler. Wenn ein Journalist auf ein Datenportal geht, einen Datensatz sich herunterlädt und damit eine Geschichte macht, die Tausende erreicht, dann kann man das halt auf dem Datenportal nicht messen.
26:42
Und Open Data ist wie gesagt keine PR-Kampagne, sondern muss echte Transparenz sein. Man macht nicht Open Data, um hohe Besuchszahlen zu haben oder um ein besseres Marketing von seiner Verwaltung herzukriegen, sondern tatsächlich um seine Bürger besser zu informieren, um der Gesellschaft damit was Besseres zu tun. Und das machen wir auch als Open Knowledge Foundation.
27:01
Wir versuchen das zu fördern. Wir bauen Werkzeuge für Open Data und auch für Informationsfreiheit. Zum Beispiel fragt den Staat.de oder auch das Portal offene Daten.de den offenen Haushalt, um Haushaltsdaten zu erklären. Open Spending, um das auch international durchzuführen. Wir haben einen Inkubator namens Stadtland Code, mit dem wir junge Entwickler fördern, auch weiter solche Apps zu bauen,
27:21
die staatliche Daten nutzen und zwischen Bürger und Staat ein besseres Verhältnis herzustellen. Und der gibt es auch auf der Republik am Morgen. Am Mittwoch. Am Mittwoch einen Vortrag von diesen Stadtland Code Leuten am Stand von New Thinking. Außerdem veranstalten wir Hackdates und Workshops und auch Konferenzen, zum Beispiel die OKCON in Genf dieses Jahr noch.
27:43
Und wir wollen mit euch mehr Daten befreien. Dazu brauchen wir eure Hilfen, eure Hilfe. Diese Beispiele funktionieren teilweise noch nicht in Deutschland. Wir wollen das mit eurer Hilfe umsetzen. Und dazu brauchen wir eure Zeit und auch euer Engagement. Diese Rakete kann halt nur abheben, wenn ihr uns helft. Wie funktioniert das zum Beispiel?
28:01
Ihr habt selber eine Idee für Daten und die gibt es aber noch nicht, beziehungsweise ihr wisst es nicht genau. Dann gebt euch auf die Suche. Es gibt da Datenportale, es gibt viele Webseiten. Versucht, diese Daten zu finden. Und wir haben auch ein Projekt namens School of Data, dass, wenn man diese Daten tatsächlich findet, euch auch hilft, mit diesen Daten zu arbeiten, das euch aber auch bei der Suche selber helfen kann.
28:21
Wenn ihr die Daten gefunden habt, aber die werden nicht rausgegeben oder ihr findet überhaupt keine Daten, dann fragt doch mal nach. Wir haben das Portal Frag den Staat, das eine Informationsfreiheitsplattform ist. Und über das Informationsfreiheitsgesetz könnt ihr gebenfalls an diese Daten herankommen. Einfach mal nachfragen. Selbst wenn ihr eine Ablehnung bekommt, ist das auch eine gute Information. Dann wissen wir, dass wir da noch mal stärker nachhaken müssen
28:42
und gegebenenfalls eine Kampagne fahren müssen. Und wenn ihr Daten bekommt, nutzt sie und sagt uns Bescheid. Wir haben eine Mailing Liste. Wir haben auch ein großes Netzwerk. Wir unterstützen euch gerne bei eurem Projekten. Das ist unsere Webseite, unser Twitter Account. Wir arbeiten gerade so auf Budget. Wir arbeiten auch viel ehrenamtlich und wir würden uns auch freuen,
29:01
wenn ihr uns Zeit, also uns unterstützt mit Zeit oder uns auch gerne etwas spendet. Vielen Dank.