Bestand wählen
Merken

Spatial Index von Solr

Zitierlink des Filmsegments
Embed Code

Automatisierte Medienanalyse

Beta
Erkannte Entitäten
Sprachtranskript
der was mit der BKG wissenschaftlicher Mitarbeiter des ist genau und er wird uns erzählen zu denen es solange es welche Index und der Verwendung dem Videoportal Erfahrungen die wir damals gemacht hat und damit ihr ok wollen ich darf euch heute was erzählen
zu dem Einsatz des so lange mit wie es momentan im Videoportal Weg machen und vor allem was wir vorhaben also seit der Version 14 ist einiges passiert bei Solar und damit
ein bisschen was von erzählen aber vielleicht erst einmal was für Daten dort
Videoportal sind also das Gigabyte HD ist eine der zentralen Komponenten der Geodateninfrastruktur Deutschland und ist letztendlich das Schaufenster in die GDI-DE das bedeutet der Katalog er sammelt die Metadaten von denen die die Partner vom Bund Länder und Kommunen ein und hat diese dann im vorliegenden XML-Formate ich mir so vorstelle ich müsste durch diese ganzen XML-Dateien suchen und und schauen und gucken da wurde mir irgendwie nach 30 Sekunden schon keinen Spaß mehr machen Deswegen wurde dieses Portal DIE entwickelt um die XML-Dateien der anwenderfreundlich darzubieten und durchsuchbar zu machen das sind
momentan 35 Kataloge der angebunden sind sogar 136 Tausend Meter dazu und in diese Metadaten zunächst mal wieder wiedergekaut sind in Sachen drin die Titel Netzwerk Schlüsselwörter Kontaktdaten aber eben und die haben auch eine geographisch Komponente und zwar die Baronin Brandenburgs wie sie das Ganze in Vorteil aus der wir haben hier
eine erweiterte Suche auf der
Suche nach Sachbegriffen und leider noch getrennt eine Ortssuche und um die ganzen Daten IMS finden zu können benutzen wir solange das ist
soll aber das hat nichts mit irgendwelchen Sonnenenergie ausnutzen zu
tun sondern es ist eben ein 2. und Museen Index ein Fremdwort ja zum Administrieren von Such Anwendung als versucht wird dabei bereitgestellt und sehen das Ganze läuft als Java-Anwendung eigentlich in allen gängigen wird Containern wie Internet oder dem verankert und basiert insgesamt auf was 7 Richtlinien für den Index eigentlich verantwortlich ist und manchmal sogar 3 haben sich die Entwickler gedacht wir lassen das Ganze in parallel laufen wird mit der Versionsnummer von das heißt so weil er 7 Update der Versionsnummer macht sie zu laden danach und anders die Version im Jahr erhöht dann ist automatisch auch 1 7 davon betroffen ja ganze lizensiert unter der Apache-Lizenz gut zu lustigen wollte ich auch nicht mehr so viel sagen sollte auch bekannt als einer der in der Uhr gewöhnungsbedürftig das bedeutet eine ganze überschaubaren was die jemand von sich aus ihnen nicht bekannt und das singen sorgten dafür dass sich durch wenige in dem das Objekt rausfällt aus der unüberschaubaren Masse so wie ich es gerne haben möchte ebenfalls der Java-Bibliothek und kompakte transportable in der es heißt es in dem Pariser Dateien die kann ich hin und her kopieren und dann auch weiterhin nutzen so Features versehen von Haus aus unterstützen eine leise ins Bett steigen und ein Highlight in den Vereinigten oben von einer von diesen ganzen Prozess gewohnt und das bietet Intel auch von Haus aus als was es ihnen nicht es ist kein Kraut und auch kein extra zu uns Polen wie stelle ich mir
das Ganze jetzt in Architekturvorgaben den Anwender der hat und wer die
Oberflächen ja aber Filme oder sonstiges gibt dann such Anforderungen Suchbegriffen Input fehlt an von diesen Input fehlt wird das ganze an Solar geschickt über beispielsweise diese URL ich hab hier mal so ich hab hier die Parameter dieses Kuh das ist der quirlige also durch indes in den Format von nach die Untaten teilte das und das heißt es wird wirklich alle indexierten Fehler gesucht und kann in die Sortierung und leicht erholen mit angeben so las ich diese Anfrage weiter an den Limousinen Index und als er sieht das Ergebnis kann beispielsweise als lesen kann die Suche Anwendung zurück geschickt werden oder aber auch als wir beispielsweise von Vorteil wenn sie eine PHP-Anwendung ist aber es geht auch über XML-Formate wir im
Videoportal verwenden momentan die Version 4. 3 unterstützt bereits Funktionen wie Facetten oder einen Filter dass sie der einzelnen aber so aus
die Suche und oberflächlich hat nach allem was wir haben Besuch ein Sternchen verwendet haben ,komma unten unsere Suchergebnisse schon bisschen kopiert der bereitgestellt auf Jahre hier
die 10 wir dass diese XML-Datei dahinter liegt in einem vernünftigen Format den also dass man als Anwender damit auch was anfangen können wir haben die
auch komplett Funktionen die Berater bereits implementiert sodass wir Pegelstände eingeben bekommen gleich in die Information was alles hinterlegt ist im Kriege Stammdaten Bestandsmessung etc. und
wir haben die Facetten nach Themengebieten sind die an externe oder die Dateitypen den dahinterliegenden wir können nach den Daten zum von wann bis wann es in diesen Metadaten mit seinen in den Metadaten Gültigkeitsdatum eingetragen wurde oder wir können nach bestimmten Maya-Stadt Bereichen sortieren was
haben wir momentan noch nicht wir haben Funktionen nicht drin oder den Inland Frieden und sowohl konfigurierte das endlich auch Vorschläge gemacht denn wenn wir nach 100 Versuchen das er in uns darauf hinweist haben nicht wollten sie mich eigentlich nach suchen oder das ähnlich ein Jahr nach ähnlichen Begriffen suchen sie beispielsweise nach einem Besuch in Kindern vorgeschlagen haben könnte Sie auch interessieren oder Highlight Funktionen sind immer noch nicht implementiert das dann aber relativ einfache Sachen die da gemacht werden können und die wir noch einmal Zukunft Videoportal Weg zu finden sein ,komma zu den Sachen warum sie
wahrscheinlich eigentlich hin und her und zwar geht es darum und die ästhetische Funktion von soll dabei sind noch nicht alle Funktionen die
ich Ihnen heute vorstelle wirklich vollumfänglich in der in der Version von Solar 4 enthalten die Version 5. erst Anfang diesen Jahres rausgekommen hatte noch nicht genug Zeit nachzugucken ob es das wirklich schon alles so drin ist wie vorgestellt da gibt es unter anderem Filterfunktion diese typischen Filterfunktionen
in der Sekte des Joint befinden in Contents aber viel interessanter sind eigentlich für so Suchergebnisse Sachen die die
eben auch wirklich das Scoring beeinflussen also das Grauen das in die Geschichte welche der welches Ergebnis sehr schön weit oben in der Trefferliste oder kann den dort weniger Prozent der unter anderem einmal die Distanz von Punkt zu Punkt Objekten arbeiten Solar unterstützt in der auch der von einem Punkt zum anderen Geometrie zum Mittelpunkt von der von Polygonen dabei muss eben von den Polygone ermittelt .punkt gar nicht mit angegeben werden das macht soll davon allein Vorteile eine spannende
Funktion ist dass er verletzt worden und zwar wenn da einfach mehrere Jahre Flächen Geometrie miteinander verschnitten und je nachdem wie wir große Überlappungen gratis Ebene wird endlich das Resultat ihrer gepunktet ja was ihnen noch fehlt sind hatten die Kulturfunktionäre ich denke aber dass die früher oder später auch direkt in den Sonnabend zum -minus Ziel mit hinein wandern werden seit
einigen Jahren haben die Wuppertaler bereits eine räumliche suchend implementiert das ist vergleichbar mit der in der 6. mit wurde dass es damals noch ein Plus 8 3 6 gewesen dabei wurde eine komplette Bibliothek separat geschrieben also dass es auch weiterhin möglich das heißt wenn sie andere Anforderungen haben konnte das weiter auch mit Java entwickeln Unternehmen nutzen also hier sind eindeutig zu sehen wir haben die Bauern in Wort und um Hannover machen dann in die Suchergebnisse und sehen das auch das Ergebnis was man sowieso oder was sich da visualisiert habe ich mit dem mit der braunen Mob mit der Anfrage übereinstimmen Hannover-Hildesheim also das ist wirklich genau das was Peter gesucht haben wir haben viel überlegt wie sie was wir denn eigentlich sonst so machen können an an zwischen Funktionen Videoportal wir haben letztendlich immer nur die braunen Boxen was immer gewünscht ist dass wir die dann für die Bundesländer verteilt das aber gar nicht so einfach und wurde aber zum Beispiel diese Oberleib Sorten Funktion helfen als
Facette so dass wir das da implementieren können und werden die AG oder bereits das Ergebnis im Index mit ablegen dabei werden die Metadaten wenngleich bei der Indexierung eine Facette zugewiesene ja nun ist es leider so dass die Bundesländer keine Quadrate oder Rechtecke sind ja das führt zu
ungewollten Überlagerungen zwischen den Ergebnissen der einzelnen Bundesländer aber das wobei hilft unter anderem in Datenfehler zunächst in die kann ich mir das vorstelle ich hab hier
mal die 3 Bundesländer A B und C mit dem die Daten die sie vorhalten diese die Daten werden über die Bauern im Boxen beschrieben wie schon gesagt dass Sie dann in etwa so aus und wenn ich mir die Facetten vorstelle dann oder für dieses Bundes und dann sehen wir hier schon für das Bundesland aber da gibt es Überschneidungen mit dem EU Datensatz aus dem Bundesland wie das bedeutet dann aber dass unsere Facetten A enthält im 3 Objekte in Grün
Gelb und Rot Rot ist eben auch eine B 1 und auch gleichzeitig in dem Bundesland und sehr enthalten Obst aber
wir sind auch hier das ihnen durch dieses erlauben Rebsorten wie das Grollen ebenso ist das Geld beim Bundesland aber wirklich ganz weit oben sollen in diese Überlappung ist vielleicht sehr sehr hoch ist grün bisschen abgeschwächt und rot kommt im wirklich und den Wald in niedrigen Überlappungen werde ähnlich bei meinem 3. Bundesland das Blau in ganz oben und droht ihm und wurde in das Suchergebnis auch weit unten ankommt was wird was für
Probleme haben wir bis jetzt festgestellt gerade Ausbildung für die Suche Videoportalen also die bauen im Boxen repräsentieren die also eigentlich nicht die Geometrien die hinter den Taten stecken das ist vielleicht
zurückgehen sehr schön zu erkennen bei den Roten Beispiel die 3 Punkte sind eigentlich eine Diagonale durch durch die braunen Boxen lassen den er eigentlich überhaupt keine Daten vorhanden sind und wer da ein ganz ganz großer
verbreitete .punkt ist das auch Boxen falsch angegeben sind wir uns wohl schon einmal gehört dass die Bauern in Bautzen Platz in Afrika aufgetaucht sind viel viel schlimmer sind aber oftmals einen braunen Boxen in Kleinkleckersdorf eigentlich enthalten die Daten angegeben sind in dem weltweiten bauen Boxen dann ist oft der Ansatz oder wird oftmals vom Himmel empfunden die kleine die Boxes umso detaillierter sind die hinterlegten Daten das können wir aber eigentlich gar nicht feststellen mit den Daten für unsere Metadaten derzeit die oder Rohdaten hinter den Metadaten die repräsentiert die kennen wir gar nicht und dementsprechend Konventionen ja so eine Definition gar nicht gar nicht
machen wobei das sind im Ansatz für diejenigen gut sein kann die in ihrer eigenen Geometrien kennen und genau wissen wie das aufgebaut ist ja das weiteren haben noch nicht alle Möglichkeiten getestet und auch vor die Performance dahinter steckt nicht durchgeführt um zu gucken was überhaupt alles vollumfänglich möglich ist also ich hab mal 100 Tausend
bauen den Boxen indexiert dass es zwischen 20 Minuten und einer Stunde ist das Ganze erledigt je nachdem wie der Genauigkeitsgrad das was von Maschine ich habe viel Arbeitsspeicher und wenn ich das ganze dann mit den typischen Funktionen in der Sekte ist eigentlich kein kein Verlust an Zeit zu nennen das ist genauso schnell wie bei Google oder wie bei der Suche wie jetzt ist alles kommt wirklich auf Knopfdruck kommen die Ergebnisse daraus ich denke das wird anders wenn wir ganze Polygonen indexieren die mehr als nur 4 Eckpunkte haben dass ich hab's mal ausprobiert mit ein paar GML Dateien wollen 32 Eckpunkte sind aber auch dass es solche bei 100 Polygon nicht getestet habe da ich davon nicht viel mit der zeitlichen Verzug und festgestellt ich denn es sieht anders aus wenn der ganze Spaß haben und was bei 1 Million Polygonen oder sonstiges der enthalten sind ja was ist der
Ausblick für die Suche im Videoportal für die nächsten Arbeitsschritte also werden auf jeden Fall auch auf die neueste 5 .punkt X Version umsteigen ich denke dass wahrscheinlich nächste Woche sogar schon 5 .punkt ein Star werden dann die von angesprochenen Funktion meinten sie Highlight in semantische Funktion implementieren und unsere große Herausforderung die wir vor einem haben ist das für die Ohren suchen und die Sache so wie ich es vorhin gezeigt habe momentan sind das 2 unterschiedliche Import für das für das Kubilai Khan ein Input Feld anbieten können ja das wollen bis Ende des Jahres mehr umgesetzt haben dass sie als unser Ziel und wir hoffen in der EU vorstellen mal gucken was da was er bis dahin geschafft haben den Kunden groß ist ist auf jeden Fall in dieser Ort suchen mit der Sache Suche zu verbinden aber nichtsdestotrotz komme über diese bräunlichen suchen tausendmal das ist gut war und das
in Full bekommt nach unsere schwarz ist das Fazit vorher einer also ich denke dass diese ganzen zwischen Operationen schon gesagt vor allem für diejenigen gut sind die ihre Daten wirklich kennen oder auch für Sachen die wurden nicht nur die Bauern Boxen eine Bedeutung sind wollen vielleicht wirklich die oder Ehlert möglich die eigentlichen Geometrien enthalten schrieb soll demnächst auch möglich sein vielleicht ist es sogar schon implementiert das sich wirklich an die wir diese steht sind 140 Tausend Polygonen den Index 7 doch die eigentlichen Polygon und die Attribute die dahinter sind das soll demnächst auch möglich sein vielleicht ist das sogar schon das kann ich leider noch nicht sagen und dann ein großer Vorteil von Solana ist auf jeden Fall dass es in diesem können wenn auch das heißt wir können in dem den Index auch nehmen aber vielleicht können wir dann auch dass sich solche verwenden wir angelegt habe ja wir haben auf jeden Fall schon nachgewiesen dass es eine hohe Skalierbarkeit hat eine 6 Milliarden Dokumente zu lasche nachgewiesen dass es ohne Probleme im Exil weisen und dann auch zu einer annehmbaren Performance wiedergegeben werden können die Suchergebnisse keine Lizenzgebühren keine Kosten in eigentlichen verwenden die Kosten entstehen natürlich in der Konfiguration in der Implementierung von Sonderwünschen und sonstigen Geschichten ja und wie gesagt dass sie bevor Performance war bisher in allen getesteten Bereichen annehmbar ist stark ja und jetzt zu dem was ich
schon vorher sagen wollte also das
Wichtigste ist letztendlich eigentlich dass die Metadaten Inhalte einfach qualitativ ausgefüllt werden müssen ansonsten ist die beste suchen nicht die besten Suchalgorithmen können da nicht unterstützen wenn es nicht schaffen unsere mit qualitativ auszufüllen ja und dann bin ich auch schon
fertig und ich bedanke mich für Ihre Aufmerksamkeit ich glaubte Holger
gerumst um das zu unterstreichen und die werden wir nicht weiterkommen ja direkt fragen zum Vortrag zu solares welche Indexing supergeile Technologie und ich wünsche mir also sind schon so lange ein von ihnen kenne ich schon super gute Fragen die dieser nicht einsetzt der wird vielleicht eine ganz praktische Fragen und zwar mit diesem Bau den Boxen japste in Berlin und Brandenburg und interessante Diskussion vom Frühjahr bis vor Ort ob denn über das DVD-Boxen mit Mittwoch sein müssen Details erfüllt und da sieht natürlich denn man kann von Berlin aus sparen kann er da wenig Daten für man neulich Berlin ich habe und er kann den werden wir jetzt erfahren wir solchen Problematiken umgegangen wird werden kann belegt aber sehr über die aber wir auch Hamburg und Obama Bundesländer gute Frage weil das dann zur Diskussion die haben wir natürlich auch schon mehrfach diskutiert da gibt es noch jede Menge philosophische Ansätze gerade dieses erlaube sollten dass der geht in den Feinheiten des konfigurierbar ich wenn ich in aus welchen großen Ausschnitt von Brandenburg suche dann kommt es natürlich zwangsläufig so dass die ganzen Berliner Daten auch auf auch letztendlich ist dann aber abhängig vom Marsch auch wie groß ist die Fläche die sich überschneiden und das heißt sie kommen auf jeden Fall erstmal in den Suchergebnissen vor wenn aber die Leitung relativ gering ist weil in komplett Brandenburg gesucht wurden dann kommen Sie weiter hinten vor ansonsten das mit den Löchern sowas haben wir eben noch nicht vor den Wahlen in den Metadaten aus ohne die Diskussion noch nicht so ausgereift sind dass eben nur Metadaten verwenden irgendwelche Märchen oder sonstigen das nicht sagen wann ich würde aber ziemlich intensiv diskutiert wobei der Schüler bei einer wir also diese beiden dass also einige von diesen Diskussion kann ich auch mit der Kollegen Vorzüge aus Ostberlin ja letztendlich ist aber so dass das wir weniger Geld für den Betrieb dieser Komponenten begrenzte Ressourcen haben und diese ganzen Spielereien für die am liebsten mehr Zeit verwenden möchte er die Zeit haben einfach nicht um und sowas im 2. Jahr auszubauen also der Entwickler wollen der für dieses Special Geschichten an zuständiges Personal der sitzt in den USA und als ich ihm von der von den Jahren immer geschickt hatten wie funktioniert denn dieses erlaube überlebt worden dass das hatte er selber auf mehreren Vorträgen vorgestellt hat mir dann zurückgeschrieben dass für jemand benutzen das ja gut also also mittlerweile sind in diesem Jahr sich zu dritt die das Testen also von daher kann ich das vielleicht nur benutzt das und ich denke ist vor auch durchaus interessant findet sich mit diesem Mehr Polygonen gearbeitet wird wenn es ja aber auch Anwendungen sind die er auf 140 Tausend Polygonen zugreifen müssen da kommen viele in der CSU bereits oder viele steht dann schon an ihr Ende und dann ist es viel viel Rechenzeit ja das ist interessant und da müssen selbst war noch mal einen kleinen Einblick gegeben dass es ein entwickeltes irgendwann angefangen hat sagte darauf aufmerksam geworden wir haben bei Google gesucht und gefunden hat ist es ein eigenes Projekt so das ist Teil der Entwicklung des Active oder Entwickler und hat im gesagt hat einen Bock drauf und ich weiss ich hab ihn gefragt wofür er verwendet und letztendlich glaube ist das aus einer Bierlaune heraus geschehen wird so und ja auf jeden Fall sind wir jetzt was für Funktion mittlerweile implementiert sind und die funktionieren und alles das ist super aber es klingt so als ob man da vielleicht auch noch mal so ein Anwender Profil machen könnte weil tagelange jetzt darüber aber das Problem ist ja tatsächlich nur ist nun ganz Brandenburg will aber das Berliner soll nicht haben dass über 90 Prozent mehr als die als Antwort das Weltall sind das heißt ist sowieso eine semantische Kisten noch mit über das steuern und so aber das Potenzial in dieser Software und da ist es interessant zu gucken ob man vielleicht durch gegen irgendwelche die dir schon Kontakt hat da auch mal gucken ob es dann noch weiter Bedürfnisse wird Hamburg Bremen gibt es aber auch in Bayern ist es auch so würden ich die Münchner Datensätze fälschlicherweise nicht bald wird hatte jeder so seine eigenen speziell für das gesagt dass das Hauptaugenmerk legen wir jetzt ist man auf diese Ortssuche Probleme .punkt oder auch ein Polygon zurückgingen dass wir das verschneite mit den Ergebnissen in den Metadaten halten und okay da war wohl meine Frage wofür brauchen wir diese Metadaten Bildung eigentlich keiner genau dafür brauchen wir die die Metadaten sind furchtbar wichtig und deswegen brauchen wir sie auch und deswegen macht es auch Sinn dass man die Ausbildung auch bereitstellen weil sonst kommt man da nicht weiter wir also wir hatten vor kurzem Anbieter wie auch den großen Gewerkschaften auch nur Metadaten und 90 Prozent derjenigen die dabei war mit der Einstellung der Metadaten braucht eigentlich kein Mensch der das macht Arbeit ich überhaupt keine Lust das zu erfüllen was ich glaube wir müssen es auch irgendwann davon lösen dass der Mehr direkt für uns entsteht am Ende mehr Geld bekommt mit der Zeit in die wir diese Daten wirklich genutzt aber dazu müsste gefunden werden und wenn ich gar nicht weiß dass diese Daten gibt einen interessieren nämlich auch nicht dann kommt irgendwann an mich ran oder einem anderen Ansatz auf deine das interessiert sie nicht ich aber das ist glaube ich ein ganz ganz großes Problem ja noch weitere fragen wir das Stichwort lässt sich so was können Sie das kurz vielleicht eine Abgrenzung geben oder ähnliche vor den Nachteil dieses Verbrechens oder sehen wir also dass wir das jetzt sollte natürlich gerade ziemlich also ich glaube der große Vorteil von von den beiden ist dass sie sich in extrem gegenseitig befruchten und zu Höchstleistungen Porsche ansonsten denke ich dass das das eine Geschichte ist nämlich in andere die Telefone nicht mehr still Telefon also das wahrscheinlich mit in der der das heute Abend wir könnten 3 Stunden diskutieren und wird nicht zu dem Ergebnis ,komma also ich glaube es wird also weiter auf jeden Fall ihre Daseinsberechtigung ich glaube dass gerade dieses 1. Variante der Solarfirmen ein ganzes Stückchen weiter ich weiß sicher jeder schon was ausprobiert ob also das Erlassen Schau durch aus sehr vieles welche Möglichkeiten und ich denke das ist jedes System hat seine Vorteile und ich glaube das ist der große Unterschied ist aber dass wird die Skalierbarkeit dass das eine der Hauptfokus der Hauptfokus ist für das die CSU und die Replikation über verschiedene auf und wobei das 5. Personal Cluster und wahrscheinlich auch ziemlich gut also also ich denke das ist wie gesagt das ist etwas Besonderes haben also wir haben auch mit der Firma zusammengearbeitet ist ein bisschen beraten haben diesen Entwickler für Solar und lasse sind auch von Musikbox zertifizieren alles und die sagen Ihnen auch letztendlich weiß basiert auf dem Sinai hat das schöne ist indes die Entwicklung bei der sie getätigt werden und die auch Solar getätigt wenn das die eigentlich alle Rückführung oder Auswirkung auf den Index an so dass beide Gemeinden eigentlich davon extrem profitieren noch Fragen ans Wasser wie die Konstellation vor allem wissen wie der Bund das ist allenfalls in Bayern die Arbeit zusammen gegeneinander können Fragen beantworten und das funktioniert ja doch das ja nicht wiedergewählt
Index
Videoportal
Besprechung/Interview
Metadaten
Videoportal
Komponente <Software>
Version <Informatik>
Geodateninfrastruktur
Solr
Computeranimation
Metadaten
Metadaten
Komponente <Software>
Meter
Internetdienst
Online-Katalog
Computeranimation
Datei
Internet
IMS
Servlet
Computeranimation
Index
Index
Highlight <Programm>
Version <Informatik>
Version <Informatik>
Softwareentwickler
Solr
Intel
Index
Parametersystem
Anwendungssoftware
Minimalgrad
URL
Ein-Ausgabe
Solr
Computeranimation
Version <Informatik>
Solr
Computeranimation
Funktion <Mathematik>
Anwendungssoftware
Stammdaten
Information
Solr
Computeranimation
World Wide Web
Funktion <Mathematik>
Metadaten
Highlight <Programm>
Solr
Computeranimation
Funktion <Mathematik>
Minimalgrad
Version <Informatik>
Version <Informatik>
Solr
Computeranimation
World Wide Web
Funktion <Mathematik>
Objekt <Kategorie>
Punkt
Content <Internet>
Minimalgrad
Version <Informatik>
Solr
Polygon
Geometrie
Computeranimation
Ebene
Overlay-Netz
Videoportal
Flächentheorie
Version <Informatik>
Gradient
Solr
Quick-Sort
Geometrie
Computeranimation
Funktion <Mathematik>
Metadaten
Index
Overlay-Netz
Quadrat
Automatische Indexierung
Minimalgrad
Computeranimation
Index
Überlagerung <Mathematik>
Objekt <Kategorie>
Overlay-Netz
Datensatz
Minimalgrad
Computeranimation
Index
Overlay-Netz
Videoportal
Display
Geometrie
FAQ
Räumliche Anordnung
Computeranimation
Index
Metadaten
Overlay-Netz
Punkt
Rohdaten
Display
Geometrie
Diagonale <Geometrie>
Computeranimation
Index
Overlay-Netz
Datei
Hauptspeicher
Minimalgrad
Vorlesung/Konferenz
Display
Geometrie
Polygon
Räumliche Anordnung
Innerer Punkt
Computeranimation
Funktion <Mathematik>
Algorithmus
Skalierbarkeit
Gruppoid
Implementierung
Ein-Ausgabe
Polygon
Räumliche Anordnung
Computeranimation
Index
Highlight <Programm>
Videoportal
Skalierbarkeit
Version <Informatik>
Konfigurationsraum
Implementierung
Attributierte Grammatik
Metadaten
Content <Internet>
Computeranimation
Große Vereinheitlichung
Google
Fläche
Rechenzeit
Polygon
Metadaten
Index
Datensatz
Skalierbarkeit
Menge
Komponente <Software>
Software
Anwendungssoftware
Vorlesung/Konferenz
Softwareentwickler
Indizierung <Informatik>

Metadaten

Formale Metadaten

Titel Spatial Index von Solr
Serientitel FOSSGIS Konferenz 2015: Münster, 11. - 13. März 2015
Anzahl der Teile 69
Autor Balschmiter, Tim
Lizenz CC-Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen und das Werk bzw. diesen Inhalt auch in veränderter Form nur unter den Bedingungen dieser Lizenz weitergeben.
DOI 10.5446/17560
Herausgeber FOSSGIS e.V.
Erscheinungsjahr 2015
Sprache Deutsch

Inhaltliche Metadaten

Fachgebiet Informatik
Abstract Seit der Version 4 bietet Solr Funktionen eines umfangreichen Spatial Indexes an. Am Beispiel des Geoportal.de sollen Erfahrungen und Einblicke in die Verwendung des Spatial Index mit Solr gegeben werden. Die GDI-DE stellt Beschreibungen und Zugangsdaten zu Geodaten von Bund, Ländern und Kommunen bereit, welche über das Geoportal.de recherchiert werden können. Über eine Volltextsuche können derzeit ca. 130000 Datensätze gefunden werden. Für einen performanten Zugriff auf die Datensätze wird die Open Source Software Solr eingesetzt. Derzeit erfolgt die Suche ausschließlich über die themenbezogenen Inhalte der Metadaten. Die GDI-DE stellt Beschreibungen und Zugangsdaten zu Geodaten von Bund, Ländern und Kommunen bereit, welche über das Geoportal.de recherchiert werden können. Über eine Volltextsuche können derzeit ca. 130000 Datensätze gefunden werden. Für einen performanten Zugriff auf die Datensätze wird die Open Source Software Solr eingesetzt. Derzeit erfolgt die Suche ausschließlich über die themenbezogenen Inhalte der Metadaten. Hierfür finden u.a. die Attribute UUID, Titel, Abstract, Keywords und Kontaktdaten aus den Metadaten Berücksichtigung. Auf Basis einer individuellen Konfiguration erstellt Solr für jede Suchanfrage ein sogenanntes Scoring. Dieses ergibt sich aus der Anzahl gefundener Suchbegriffe und deren Position im Datensatz und bestimmt die Platzierung in der Ergebnisausgabe. Seit der Version 4 bietet Solr die Möglichkeit einer erweiterten geobasierte Suche an. Diese beinhaltet GIS-Funktionalitäten wie Distance, Contains, Intersects und Within zum Verarbeiten von Punkt-, Linien- und Flächengeometrien. Neben der Verwendung für das Scoring bietet es sich an die Suchergebnisse über diese Operationen gezielt vom Nutzer filtern und sortieren zu lassen. Um die GIS-Funktionen nutzen zu können werden die in den Metadaten angegebenen Bounding Boxen indexiert. Aktuell befinden sich diese Funktionen in der Testphase. Der Vortrag soll Einblicke und Erfahrungen im Umgang mit einem räumlichen Index auf Basis von Solr vermitteln.

Zugehöriges Material

Ähnliche Filme

Loading...
Feedback