Wie sortiert man Orte nach Wichtigkeit, wenn sie den gleichen Namen haben? Wir schauen uns Daten zu Suchverhalten, Größe, Bevölkerungsdichte, Tagging in OpenStreetMap und Verlinkung in Wikipedia/Wikidata anhand des Nominatim Geocoders an. Der Nominatim Geocoder nutzt OpenStreetMap, minütlich aktualisiert. Die Suchergebnisse werden nach Relevanz sortiert. Einige Faktoren, wie dass Ländernamen wichtiger sind als Strassennamen sind jedem klar. Auf Mailinglisten kommt aber hin und wieder die Frage auf warum genau ein Ort wichtiger eingeschätzt wird als ein anderer. Frankfurt gibt es zweimal, beide sind grosse Städte. Münster gibt es mehrfach (http://de.wikipedia.org/wiki/M%C3%BCnster). Sogar Paris, Berlin und Frankreich sobald man die ganze Welt betrachtet. Nominatim nutzt u.a. einen vorberechneten Score (numerischer Wert), der auf den Verlinkungen innerhalb Wikipedia basiert. Die erste Version sogar auf Seitenabrufen. Das hat Vor- und Nachteile (und Bugs). Leider sind selbst für Nutzer (Administratoren) von Nominatim die Algorithmen dahinter nicht transparent genug. Viele laden einfach eine selten aktualisierte Binärdatei von http://www.nominatim.org/. Ich arbeite bei http://data.opencagedata.com/index.html#about-section und wir bieten einen Geocoder u.a. auf Basis von Nominatim an http://geocoder.opencagedata.com/. Ich arbeite seit 2006 Jahren mit geocodern mit underschiedlichen kommerziellen und offenen Daten. |