Datenqualität von OSM in der Schweiz
This is a modal window.
Das Video konnte nicht geladen werden, da entweder ein Server- oder Netzwerkfehler auftrat oder das Format nicht unterstützt wird.
Formale Metadaten
Titel |
| |
Serientitel | ||
Anzahl der Teile | 31 | |
Autor | ||
Lizenz | CC-Namensnennung 3.0 Unported: Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen. | |
Identifikatoren | 10.5446/15840 (DOI) | |
Herausgeber | ||
Erscheinungsjahr | ||
Sprache |
Inhaltliche Metadaten
Fachgebiet | ||
Genre | ||
Abstract |
|
3
6
7
12
13
14
16
20
25
26
27
00:00
MomentenproblemZahlenbereichInformationsqualitätZählenAlgorithmusMechanismus-Design-TheorieVorzeichen <Mathematik>Computeranimation
01:23
Gebiet <Mathematik>Gesetz <Physik>MAPMAPPERDichte <Physik>
02:55
UngleichungDigitalfilter
03:18
RoutingGeschwindigkeitLängeBerechnungOrdnung <Mathematik>TabelleLängeInternetdienstMAPRoutingComputeranimation
04:37
NetzadresseGravitationsgesetzMAP
05:52
ComputersicherheitEichtheorieNetzadresseDatensatzKurveMAPPERQuick-SortSet-Top-BoxGruppoidComputeranimation
09:03
MAPMomentenproblemKoordinatenMeterStatistikUmweltdatenComputeranimation
12:07
HTMLInformationsqualitätRouterMAPWanderwelleZahlenbereichZahlLinieWeb-SeiteStatistikProgrammiergerätWeb SiteOrdnung <Mathematik>DickeKeller <Informatik>Computeranimation
15:32
World Wide WebHTMLDatentypKorrelationRouterDichte <Physik>DatenerfassungDatenbankDatensatzSet-Top-BoxWort <Informatik>Norm <Mathematik>PrognoseVorlesung/Konferenz
20:49
ChipkarteGebiet <Mathematik>InformationsqualitätPhysikalische GrößeMAPPERBesprechung/Interview
Transkript: Deutsch(automatisch erzeugt)
00:03
Herzlich willkommen zu meinem Vortrag. Das ist so ein Gemeinschaftsprojekt, das im SOSM entstanden ist, im Schweizer OSM-Verein. Und wir haben da mal versucht, ein bisschen zu quantifizieren, wie gut ist im Moment eigentlich die Datenqualität von Open-Street-Map in der Schweiz.
00:30
Zuerst die große Warnung. Wir haben nur einige wenige Aspekte abgedeckt. Ihr
00:41
werdet dann sehen, einfach wirklich nur einzelne Ausschnitte quasi, ganz spezifisch Hotels, Autobahnen. Die präsentierten Zahlen sind einfach mit Vorsicht zu genießen. Ich habe das zum ersten Mal gemacht. Ich habe noch keinen Algorithmus, um Duplikate zu filtern.
01:05
Ich habe keinen Mechanismus, um False-Positives zu finden. Wenn jemand einfach lustig sagt, dort hat es ein Hotel, dann wird das als Hotel gewertet, auch wenn dort gar keines ist. Also das trägt nicht negativ zu der Qualität bei. So als Anfang für die, die auch nicht so mit der Geographie von der Schweiz vertraut sind.
01:36
Die Bevölkerungsdichte-Karte. Man wird dann sehen, gewisse Qualitätsaspekte korrelieren recht gut mit der Dichte.
01:45
Also dort, was viele Leute hat, hat es auch sehr viele Mapper und die sind dann fleissig am Mappen. Und dann halt irgendwo in den Alpen, dort hat es recht wenig Leute, entsprechend auch weniger Mapper. Und für den einzelnen Mapper wird das abzudeckende Gebiet viel, viel grösser. Die
02:01
Strecken werden viel grösser. Entsprechend ist dort weniger erfasst, ist die Dichte kleiner. Als erstes mal die Autobahnen. Das ist so die Lowhanging Fruit. Da gab es einen
02:25
grossen Sprung im 2007. Und seit 2008 sind eigentlich sämtliche Autobahnen in der Schweiz gemappt. Autobahnen sind von Gesetzeswegen baulich richtungsgetrennt. Die werden auch in Open
02:41
Street Map als richtungsgetrennte Fahrbahn erfasst. Entsprechend ist die Kilometeranzahl natürlich halbiert. Und das scheint relativ stabil zu bleiben. Das wäre die Karte von den Autobahnen. Was
03:04
nicht enthalten sind, sind die Autostraßen. Die wären dann schon wieder komplizierter zum Filtern und Vergleichen. Ich habe da auch mal exemplarisch etwas angeschaut. Die Autobahn scheint zu stimmen. Wäre auch verwunderlich, wenn es nicht so wäre.
03:21
Das führt mich dann zum Autorouting. Es gibt da eine Routing-Tabelle, wo einfach für einige grosse Schweizer Städte eine Tabelle gemacht wurde von Aarau nach Bern. Wie viele Kilometer sind das und wie viel Zeit berechnet? USRM wurde hier als Routing
03:47
-Engine auf Open Street Map verwendet. Die berechnete Länge ist durchaus vergleichbar mit etablierten Routing-Diensten. Die berechnete Fahrzeit ist unterschiedlich. Open Street Map hat noch nicht flächendeckend
04:07
die Geschwindigkeitsbegrenzungen. Open Street Map hat gar keine Daten zu erwartenden Durchschnittsgeschwindigkeiten. Was in USRM auch nicht enthalten ist, sind Daten zu aktuellen Staus. Wenn man Routing
04:28
machen will, muss man zusätzlichen Aufwand für ein Navigationsgerät hineinstecken, um diese Daten verfügbar zu machen.
04:41
Dann das Straßennetz auf benahmsten Straßenebene, also Quartierstraßen, Straßen in der Stadt, Straßen, die relevant sind für Adressen. Da gibt es in der Schweiz die sogenannte GWR-Liste, das ist das
05:01
Gebäude- und Wohnungsregister. Dort sind alle Straßen verzeichnet, wo irgendeine Adresse dran liegt. Das heisst, wir haben da eine relativ zuverlässige Quelle, was die Straßennamen anbelangen und wir wissen in welcher Gemeinde die liegen.
05:22
Diese Grafik zeigt jetzt, wie vollständig die einzelnen Gemeinden, wie viele Prozent von diesen Straßen, die wir wissen, vorhanden sein müssen, wie viele das effektive in Open Street Map vorhanden sind. Da zeigt sich jetzt recht deutlich die stark besiedelten Regionen, die sind
05:45
da schon ziemlich grün. Alpenraum, Tessinen, Graubünden, das ist noch sehr schwach. Dann noch ein Level tiefer unten, das wären dann die Adressen. Dort haben wir keine Referenzdaten,
06:04
aber man hat vielleicht so einen Abschätzungswert, wie viele Adressen man so erwarten kann pro Einwohner. Das sollte sich nicht allzu stark variieren. Da haben wir einen Vergleichswert von Dänemark, dort wurde ein Adressimport durchgeführt.
06:29
Dort gibt es dann etwa 0,4 Adressen pro Einwohner und diese Grafik zeigt jetzt mal, wie viele Adressen pro Einwohner haben. Die Adressen, da haben wir schon noch relativ wenig, das wurde erst so
06:45
gerade angefangen, eine Hausnummer zu mappen. Da gibt es sicher noch einiges zu tun. Was immer interessant ist, sind die Grenzen. Dass ich die Grafiken überhabe, so gemeindeweise zeigen konnte, brauche ich natürlich die Grenzen.
07:05
Dort haben wir nicht alle selbst erfasst, die wurden von Swiss Topo importiert und die sollten darum eigentlich auch einigermassen von der offiziellen Seite her stimmen. Jetzt gibt es immer wieder gewisse Mutationen in diesen Gemeindegrenzen und dort hat OpenStreetMap
07:28
einen gewissen Pluspunkt, weil Swiss Topo veröffentlicht die Gemeindegrenzen immer nur einmal im Jahr. Und das heisst, wenn es gemeinde Mutationen gibt, ist dieser Datensatz meist hinter ein paar Monate hinterher.
07:44
Und jetzt im letzten großen Rutsch von Gemeindemutationen gab es vor allem Gemeindiffusionen, keine neuen Grenzverläufe sind entstanden. Das konnten wir in OpenStreetMap sehr schnell anpassen, war eine ziemliche Arbeit, aber wir waren schneller als Swiss Topo.
08:06
Dann öffentlicher Verkehr. Wir haben das Eisenbahnnetz gemapt seit 2010. Dass die Kurve jetzt immer noch ansteigt, das liegt daran, dass nun fleißige Mapper daran sind, alles spurgenau zu mappen.
08:25
Also wir haben schöne neue Luftbilder von Bing und jetzt wird dort, wo es zweigleisig ist, werden wirklich auch zwei Gleise eingetragen. Das habe ich jetzt nicht rausgefiltert, dann steigt es die Kurve immer noch friedlich weiter.
08:44
Und so sieht das Eisenbahnnetz aus. In der Schweiz gibt es zwei Spurbreiten. Die Normalspur, bekannt von der SBB, und dann von den verschiedenen Privatbahnen oder historisch bedingt gibt es die Schmalspurstrecken, die sind hier grün eingezeichnet.
09:10
Die ÖV-Haltestellen. Dort gibt es eine Liste vom Bundesamt für Verkehr, vom BAV, die sogenannte Didock-Liste.
09:22
Dort sind aus administrativen Gründen sämtliche Haltestellen des öffentlichen Verkehrs erfasst, größtenteils mit Koordinaten. Diese Liste ist frei verfügbar, das heisst wir dürfen die in Open Street Map verwenden, aber die Qualität ist etwas fragwürdig.
09:47
Es gab da durchaus Fälle, wo die Haltestelle mitten im See liegt oder mitten in einem Wald oder auch einfach nur ein paar hundert Meter von der tatsächlichen Position entfernt.
10:05
Alte Haltestellen, die nicht gelöscht wurden, die es eigentlich schon lange nicht mehr gibt. Wir haben trotzdem diese Daten importiert, unter Berücksichtigung natürlich, dass wir die bestehenden Daten, die bereits gemacht wurden, nicht zerstören.
10:25
Seither wurde auch fleissig diese Haltestellen überprüft. Und die Statistik sieht jetzt so aus, dass im Moment 70% von den importierten Daten wurden in Open Street Map irgendwann mal bearbeitet.
10:41
Da gehe ich davon aus, dass die meisten davon an die richtige Stelle geschoben werden, dass dort unsere Daten jetzt stimmen. Wir haben auch einen weiteren Vorteil in Open Street Map. Wir mappen die Haltestellen richtungsgetrennt. Gerade im Bushaltestellen ist es üblich, dass die nicht genau gegenüber liegen, sondern zum Teil etwas erschoben sind.
11:06
Das bietet die Didock-Liste nicht an. 20% der Haltestellen in Open Street Map sind bereits mehr als ein Punkt gemapped. Der Import fand in 2010 statt. Seither hat sich auch einiges getan auf Didock-Seite.
11:28
Das heisst, Didock hat nun 2000 Haltestellen, die in Open Street Map im Moment fehlen. Da gibt es durchaus noch einen Aufholbedarf.
11:42
Das ist die geografische Verteilung. Die grünen Punkte, wo wir die Haltestellen in Open Street Map mal angefasst wurden, und orange Punkte. So wurden die Daten importiert und seither hat das niemand korrigiert.
12:01
Dort wissen wir nicht, ob die Haltestelle wirklich noch vorhanden ist oder ob sie am falschen Punkt liegt. Dann Thema Points of Interest. Das war eigentlich die größte Knacknuss, da irgendetwas zu finden. Das einzige, was ich gefunden habe, ist eigentlich das Gastgewerbe.
12:24
Dort gibt es Zahlen von der Betriebszählung vom Bundesamt für Statistik. Dort wurden 23.000 Restaurants gezählt im Jahr 2005. In Open Street Map wurden etwa 10.000 Restaurants erfasst bis 2013.
12:49
Was mich an dieser Grafik fasziniert ist, wie extrem linear die ist. Irgendwo im Jahr 2008 fängt es an und dann ist es einfach eine gerade Linie.
13:01
Da fragt man sich, ob es so weitergeht. Ganz ähnlich sieht es aus bei den Hotels. Auf die Hanna gibt es etwas weniger. Knapp 5'000 Hotels kennt das BFS. Open Street Map gibt es bis jetzt 2'500 Hotels.
13:30
Dann Freizeit, Wanderwelle und Skatingrouten. In der Schweiz gibt es den Freien Schweiz Mobil,
13:45
der die nationalen oder regionalen Wander-, Velo- und Skatingrouten betreut. Der hat auch eine sehr gute Website, wo man die Routen anschauen kann. Unterdessen haben wir auch sehr viele von diesen Routen in Open Street Map integriert.
14:08
Wanderwege gibt es angeblich etwa 60'000 Kilometer. Die Schweiz hat ein sehr dichtes Netz an Wanderwegen. In dieser Zahl ist alles drin, also jeder lokale Weg.
14:23
Man kennt sie, die kleinen gelben Wegweiser. Von diesen sind noch nicht so viele erfasst. Aber immerhin 10'000 Kilometer Wanderrouten ist schon mal etwas. Die Velo-Wege sind bei weitem am besten erfasst.
14:43
Vermutlich sind die einfach am einfachsten zu mappen. Man kommt mit dem Fahrrad, falls ihr mich nicht versteht, Schweizer Begriffe. Man kommt mit dem Velo einfach sehr schnell voran. Da gibt es die Einteilung in nationale Routen, regionale Routen und lokale.
15:07
Die nationalen Routen haben wir schon seit ein paar Jahren komplett. Bei den regionalen Routen fehlt noch etwas, aber das ist auch nicht mehr so viel.
15:21
Da habe ich keine globalen Zahlen mehr zusammengesucht. Da müsste ich dann auf der Webseite jede Route einzeln anklicken und das alles zusammenzählen. Das war mir dann etwas zu viel Arbeit. Dann noch die Skatingrouten.
15:40
Etwas neuer auch bei Schweizmobil. Dort scheint auch immer noch etwas dazuzukommen. Hier haben wir 460 Kilometer von momentan 625 Kilometern, die das Skatingland, also Schweizmobil, kennt.
16:05
Damit wäre ich schon am Schluss. War etwas zu schnell. Die Frage wäre jetzt, wie geht es eigentlich weiter? Können wir diesen linearen Verlauf weiterführen?
16:21
Wir haben im Jahr 2015 bereits alle Strassen namen. Wir haben im Jahr 2018 sämtliche Hotels und im Jahr 2020 alle Restaurants.
16:40
Wir werden sehen. Danke für die Aufmerksamkeit.
17:02
Also Fragen? Ein bisschen laut. Was war denn das Kriterium, um etwas als Wanderweg zu kategorisieren? Dass es als Route mit Type Hiking erfasst ist.
17:25
Relation, ja. Also bei den Velo-, Wander- und Skatingrouten, da wurden einfach die Relations gezählt. Ausgewertet.
17:53
Danke sehr. Gibt es einen numerischen Wert für die Korrelation zwischen Dichte der Datenerfassung und Bevölkerung?
18:02
Und aus Großbritannien kenne ich eine Studie von Mucki Heckli, die sagt, vor allem so zirkonymisch schlechter gestellte Regionen seien weniger dicht gemäppt. Gibt es da irgendwelche Angaben in der Schweiz? Nein, habe ich leider keine Auswertung dazu gemacht.
18:24
Wäre durchaus interessant, aber die Frage wäre, also ökonomisch schlechter gestellt, dann müsste man dann auch zuerst wieder Daten suchen zur Ökonomie.
19:00
Werden die Gemeindegrenzen systematisch in OpenStreetMap erfasst? Oder wie läuft das genau mit den Daten von Swiss Topo? Also die wurden einmal importiert und seither sind wir eigentlich davon gekommen, indem wir dann einfach auf diesen Import dann aufbauend die Mutationen dann durchgeführt haben.
19:27
Also es hat jetzt einen Fall gegeben, wo wir dann ein kleines Stück neue Grenze von Swiss Topo holen mussten, aber das wurde dann alles von Hans gemacht.
19:42
Markus Senn, wir haben eine Datenbank zur Verfügung, die pro Jahr ungefähr 200 Millionen Datensätze produziert über Fortbewegungsgeschwindigkeiten auf öffentlichen Straßen. Wenn uns also hier jemand ist, der ein Interesse daran hat, diese Daten zu integrieren in eine Navi-Vorhersage oder Navi-Qualität,
20:00
kann ich mich gerne ansprechen. Also Sie sind nur noch frei und nicht in Verfügung? Ja, das sind Sie.
20:43
Ich habe noch, da ich ja auch beteiligt war in dem Vortrag, auch noch eine kleine Bemerkung wegen den ökonomisch benachteiligten Regionen. Das gibt es eigentlich in der Schweiz nicht. Zumindest nicht im Vergleich zu England.
21:00
Was man bei uns sieht, ist schon, dass in den ländlichen Gebieten, wo die Bevölkerung weniger dicht ist, da ist auch die Datenqualität schlechter, wobei das nicht universell gilt, weil die Schweiz ist so klein, dass einzelne Mapper durchaus einen Unterschied machen können, relativ große Gebiete abdecken können.
21:22
Was man aber sieht, glaube ich bei allen Karten, ist, dass das Tessin nicht allzu gut erfasst ist, weil wir dort sehr wenig lokale Mapper haben. Obwohl die Bevölkerungsdichte dort nicht super klein ist, sind es doch meistens Leute aus der Deutschschweiz.
21:40
Aber auch die Genfersee-Region, die die absolut höchste Einwohnerdichte hat, ist erstaunlich schlecht gemerkt eigentlich. Okay, das war noch eine Bemerkung von mir dazu. Wenn keine weiteren Fragen sind, schlage ich vor, dass wir zehn Minuten Pause machen,
22:01
weil die Luft hier drin ist wirklich langsam grenzfertig und sind um Haupt wieder hier für Jochens Vortag.