We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

From text search and recommendation to ads and online dating; approximate nearest neighbors in real world applications

00:00

Formale Metadaten

Titel
From text search and recommendation to ads and online dating; approximate nearest neighbors in real world applications
Alternativer Titel
From text search & recommendation to ads & online dating
Serientitel
Anzahl der Teile
69
Autor
Mitwirkende
Lizenz
CC-Namensnennung 3.0 Unported:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache

Inhaltliche Metadaten

Fachgebiet
Genre
Abstract
Anything can be represented by a vector. Text can be represented by vectors describing the text's meaning. Images can be represented by the objects it contains. Users of a system can be represented by their interests and preferences. Even time-based entities such as video, sound, or user interactions can be represented by vectors. Finding the most similar vectors has all kinds of useful applications. There are many libraries to choose from for similarity search. However, in real-world applications, there are additional complications that need to be addressed. For instance, similarity search needs to scale up while ensuring that data indexed in the system is searchable immediately without any time-consuming index building in the background. Most importantly, however, additional search filters are often combined with the similarity search. This can severely limit the end result's quality, as post-filtering can prevent otherwise relevant results from surfacing. In this talk, we'll explore some real cases where combining approximate nearest neighbors (ANN) search with filtering causes problems. The solution is to integrate the ANN search with filtering, however, most libraries for nearest-neighbor search work in isolation and do not support this. To our knowledge, the only open-source platform that does is Vespa.ai, and we'll delve into how Vespa.ai solves this problem.
Kartesische KoordinatenNeuronales NetzVirtuelle MaschineSystemplattformSoftwareplattformProgrammbibliothekHypermediaGruppenoperationXMLUML
SystemplattformSystemplattformTensorComputerSoftwareplattformKartesische KoordinatenTypentheorieAbfrageVirtuelle MaschineMultiplikationsoperatorEndliche ModelltheorieQuellcodeZeichenkettePhasenumwandlungFormation <Mathematik>Wurzel <Mathematik>Open SourceZwei
VektorraumAbfrageRegulärer GraphAbstandFunktion <Mathematik>Trigonometrische FunktionWinkelEuklidischer RaumProdukt <Mathematik>VektorpotenzialSystemplattformSelbstrepräsentationMultiplikationInstantiierungProgrammbibliothekGebäude <Mathematik>GruppenoperationEinflussgrößeVektorraumKartesische KoordinatenMultigraphPhysikalisches SystemStellenringAutomatische IndexierungRechter WinkelRelativitätstheorieÄhnlichkeitsgeometrieThreadEinfache GenauigkeitBefehlsprozessorMinkowski-MetrikProdukt <Mathematik>CASE <Informatik>DatenstrukturDifferenteAbstandQuick-SortForcingVektorrechnerZentrische StreckungDickeGeometrische QuantisierungResultanteAbfrageDienst <Informatik>SoftwareplattformObjekt <Kategorie>PunktBildgebendes VerfahrenSchwach besetzte MatrixInteraktives FernsehenMAPWinkelRechenschieberSchnittmengeWeb SiteFunktionalEinsBitCodierung <Programmierung>GrundraumTypentheorieFrequenzStapeldateiGraphSystemaufrufHyperbelverfahrenAlgorithmusImplementierungInformation RetrievalArithmetische FolgeDomain <Netzwerk>MultiplikationsoperatorFacebookComputerunterstützte ÜbersetzungBestimmtheitsmaßElektronische PublikationGoogolVideokonferenzBenchmarkDimensionsanalyseZahlenbereichTeilmengeMailing-ListeArithmetisches MittelZweiInverseNavigierenSoftwareentwicklerMetadatenZentralisatorKlassische PhysikElementargeometrieInklusion <Mathematik>Euklidischer RaumInformationComputeranimation
MetadatenDienst <Informatik>ProgrammbibliothekInformationXMLUML
MetadatenDigitalfilterSpannweite <Stochastik>Geschlecht <Mathematik>Abelsche KategorieStellenringEinbettung <Mathematik>Profil <Aerodynamik>Quick-SortProdukt <Mathematik>CASE <Informatik>Figurierte ZahlInformation RetrievalMatrizenrechnungResultanteStellenringEinsMetadatenFilterung <Stochastik>TeilbarkeitAutomatische DifferentiationKommandospracheSelbstrepräsentationMapping <Computergraphik>Prozess <Informatik>Euklidischer RaumAbstandAbfrageSpannweite <Stochastik>KonfigurationsraumKartesische KoordinatenMAPFunktionalStichprobenumfangDifferenteMinkowski-MetrikMatchingPunktStreaming <Kommunikationstechnik>Endliche ModelltheorieVektorrechnerKategorie <Mathematik>VektorraumBitfehlerhäufigkeitSkalarproduktraumDebuggingTransformation <Mathematik>MinimalgradWeb-SeiteRechter WinkelToken-RingUnendlichkeitFilter <Stochastik>ÄhnlichkeitsgeometrieSoundverarbeitungSchlussregelDimensionsanalyseDienst <Informatik>BenutzerprofilURLSchnittmengeBildgebendes VerfahrenAlgorithmusLokales MinimumArithmetisches MittelFlickrFormation <Mathematik>YouTubeFormale SpracheInhalt <Mathematik>MultiplikationsoperatorDynamisches SystemInstantiierungTurm <Mathematik>Message-PassingTUNIS <Programm>Formale SemantikGruppenoperationGeschlecht <Mathematik>BitrateLineare OptimierungComputeranimationXML
ZahlenbereichAutomatische IndexierungInstantiierungMetadatenProgrammbibliothekKonfiguration <Informatik>SoftwarePhysikalisches SystemFilterung <Stochastik>MultiplikationsoperatorSoftwareplattformKomplex <Algebra>Filter <Stochastik>Prozess <Informatik>PunktSchaltnetzMailing-ListeXMLUML
AbfrageFilterung <Stochastik>TUNIS <Programm>Mailing-ListeAlgorithmusPunktwolkeVersionsverwaltungOpen SourceAutomatische IndexierungSummierbarkeitCASE <Informatik>ÄhnlichkeitsgeometrieKartesische KoordinatenImplementierungEndliche ModelltheorieFigurierte ZahlVirtuelle MaschineTransformation <Mathematik>Klassische PhysikFitnessfunktionTrennschärfe <Statistik>App <Programm>GraphStichprobenumfangWeb logSuchmaschineTabelleInformation RetrievalKonfigurationsraumDatenstrukturSchwellwertverfahrenZahlenbereichArithmetisches MittelResultanteVektorraumSharewareFlächeninhaltGüte der AnpassungPartielle DifferentiationBitfehlerhäufigkeitNeuronales NetzAlgorithmische LerntheorieComputeranimation
Information RetrievalDebuggingImplementierungWeb SiteBenchmarkArithmetischer AusdruckPhysikalisches SystemMereologieÄhnlichkeitsgeometrieProgrammbibliothekFunktionalMatchingCodeRechenbuchBasis <Mathematik>sinc-FunktionAppletEndliche ModelltheorieRechenschieberGüte der AnpassungExpertensystemPhasenumwandlungFokalpunktAbfrageFächer <Mathematik>BildschirmmaskeHyperbelverfahrenComputerInhalt <Mathematik>OrtsoperatorFront-End <Software>Quick-SortSpeicherabzugVirtuelle MaschineSichtenkonzeptTensorUmwandlungsenthalpieKontextbezogenes SystemAutomatische DifferentiationKartesische KoordinatenBitRechter WinkelRankingAlgorithmusRichtungInstantiierungWhiteboardPaarvergleichNachbarschaft <Mathematik>
XMLUML
Transkript: Englisch(automatisch erzeugt)