We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Word2Vec model to generate synonyms on the fly in Apache Lucene

00:00

Formale Metadaten

Titel
Word2Vec model to generate synonyms on the fly in Apache Lucene
Serientitel
Anzahl der Teile
56
Autor
Mitwirkende
Lizenz
CC-Namensnennung 3.0 Unported:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache

Inhaltliche Metadaten

Fachgebiet
Genre
Abstract
If you want to expand your query/documents with synonyms in Apache Lucene, you need to have a predefined file containing the list of terms that share the same semantic. It's not always easy to find a list of basic synonyms for a language and, even if you find it, this doesn’t necessarily match with your contextual domain. The term "daemon" in the domain of operating system articles is not a synonym of "devil" but it's closer to the term "process". Word2Vec is a two-layer neural network that takes as input a text and outputs a vector representation for each word in the dictionary. Two words with similar meanings are identified with two vectors close to each other. This talk explores our contribution to Apache Lucene that integrates this technique with the text analysis pipeline. We will show how you can automatically generate synonyms on the fly from an Apache Lucene index and how you can use this new feature along with Apache Solr with practical examples!
Streaming <Kommunikationstechnik>Verhandlungs-InformationssystemFormation <Mathematik>Güte der AnpassungOpen SourceWeg <Topologie>Software EngineeringMinimalgradVorgehensmodellXMLUMLVorlesung/KonferenzBesprechung/Interview
Binder <Informatik>SoftwareMinimalgradComputerCodierungstheorieStammdatenInformation RetrievalMaschinelles LernenBenutzerfreundlichkeitData MiningInformation RetrievalGrundraumVirtuelle MaschineIntegralData MiningAlgorithmische LerntheorieMessage-PassingGüte der AnpassungComputeranimationVorlesung/Konferenz
LeistungsbewertungVorgehensmodellProgrammierspracheNatürliche ZahlRankingÄhnlichkeitsgeometrieBenutzerfreundlichkeitLuceneOpen SourceInformation RetrievalOpen SourceHybridrechnerProjektive EbeneWeb SiteNatürliche SpracheTwitter <Softwareplattform>LeistungsbewertungRankingVorgehensmodellInformation RetrievalExpertensystemBridge <Kommunikationstechnik>SoftwareEreignishorizontVorlesung/KonferenzComputeranimation
ÄhnlichkeitsgeometrieRankingLeistungsbewertungTUNIS <Programm>AnalysisImplementierungAbfrageInverser LimesMultiplikationsoperatorWärmeausdehnungAutomatische IndexierungAggregatzustandAlgorithmusVorlesung/KonferenzComputeranimation
AbfrageWärmeausdehnungInformation RetrievalPrädikatenlogik erster StufeAutomatische IndexierungAbfrageMultiplikationsoperatorKontextbezogenes SystemSuchmaschineVorlesung/KonferenzComputeranimation
AbfrageAutomatische IndexierungGraphDigitalfilterAggregatzustandWärmeausdehnungPrädikatenlogik erster StufeProblemorientierte ProgrammierspracheDämon <Informatik>Physikalisches SystemVorgehensmodellSuchmaschineAggregatzustandWärmeausdehnungWort <Informatik>InformationDifferenteOrdnung <Mathematik>Mapping <Computergraphik>MomentenproblemPrädikatenlogik erster StufeProgrammierspracheGraphMultiplikationsoperatorDämon <Informatik>Mailing-ListeSoftwarewartungProblemorientierte ProgrammierspracheArithmetisches MittelPhysikalisches SystemGewicht <Ausgleichsrechnung>VorgehensmodellHydrostatikCodeDatenbankGrundraumElektronische PublikationInverser LimesEinsReelle ZahlKontextbezogenes SystemVorlesung/KonferenzBesprechung/InterviewComputeranimation
Formale GrammatikSpezialrechnerQuellcodeEinbettung <Mathematik>Formale SemantikMinkowski-MetrikPrädikatenlogik erster StufeÄhnlichkeitsgeometrieVektorrechnerNeuronales NetzAlgorithmusEin-AusgabeSelbstrepräsentationFeldrechnerDivergente ReiheStatistische HypotheseReelle ZahlComputerspielKontextbezogenes SystemSchlussregelFormale GrammatikVirtuelle MaschineWort <Informatik>Prädikatenlogik erster StufeVorgehensmodellNeuronales NetzArithmetisches MittelFormale SemantikAlgorithmusEinbettung <Mathematik>ZahlenbereichProgrammierspracheSuchmaschineMailing-ListeEin-AusgabeFeldrechnerFunktion <Mathematik>Divergente ReiheStatistische HypotheseÄhnlichkeitsgeometrieSelbstrepräsentationMatchingResultanteInformationDistributionenraumVorlesung/KonferenzComputeranimation
Codierung <Programmierung>FeldrechnerEin-AusgabeWort <Informatik>Einbettung <Mathematik>Gewicht <Ausgleichsrechnung>MatrizenrechnungHausdorff-DimensionFunktion <Mathematik>Neuronales NetzVektorrechnerSummierbarkeitPrognoseverfahrenKontextbezogenes SystemAxonometrieGruppenoperationOpen SourceAppletProgrammbibliothekSoftwareentwicklerImplementierungVorgehensmodellDesintegration <Mathematik>Unüberwachtes LernenVektorrechnerFormale SemantikMinkowski-MetrikVorgehensmodellEin-AusgabeInformationWort <Informatik>Funktion <Mathematik>Neuronales NetzEinbettung <Mathematik>Gewicht <Ausgleichsrechnung>BiegungMatrizenrechnungDifferenteKontextbezogenes SystemComputerarchitekturAnalytische FortsetzungAlgorithmusParametersystemBildschirmfensterFeldrechnerSelbstrepräsentationLoopZahlenbereichBildschirmmaskeProgrammierspracheGüte der AnpassungQuaderDämpfungSoftwaretestRechenschieberElektronische PublikationOpen SourceComputerunterstützte ÜbersetzungImplementierungDatensatzProgrammbibliothekComputerschachSoftwareentwicklerCASE <Informatik>WellenpaketMomentenproblemAuswahlaxiomInterface <Schaltung>AppletMehrrechnersystemVorlesung/KonferenzComputeranimation
FeldrechnerFunktion <Mathematik>Hausdorff-DimensionVorgehensmodellInformationMAPFeldrechnerMereologieDimensionsanalyseDefaultMotion CapturingComputeranimationXMLUMLVorlesung/Konferenz
WärmeausdehnungVorgehensmodellBenchmarkFeldrechnerAbfrageÄhnlichkeitsgeometrieTrigonometrische FunktionPrädikatenlogik erster StufeVektorrechnerBenutzerfreundlichkeitSpezialrechnerPhysikalische TheorieMultigraphHierarchische StrukturNachbarschaftsgraphGraphMailing-ListeInformation RetrievalParserKonfigurationsraumParametersystemDefaultDateiformatLokales MinimumGraphMailing-ListeInformation RetrievalAbfrageParserVorgehensmodellProgrammbibliothekWärmeausdehnungDateiformatAlgorithmusNavigierenÄhnlichkeitsgeometrieEin-AusgabeElektronische PublikationPrädikatenlogik erster StufeStreaming <Kommunikationstechnik>DefaultLokales MinimumTeilmengeGrößenordnungVektorrechnerFeldrechnerVerschlingungZahlenbereichMAPAbstandImplementierungZusammenhängender GraphQuellcodeVektorraumDatenstrukturSyntaktische AnalyseOrdnung <Mathematik>ComputerspielVersionsverwaltungWort <Informatik>SoftwaretestNotebook-ComputerVererbungshierarchieMereologieToken-RingMultiplikationsoperatorDifferenteParametersystemSchnittmengeInverser LimesWald <Graphentheorie>CASE <Informatik>ApproximationPhysikalischer EffektRechenschieberMultifunktionArithmetisches MittelFormation <Mathematik>PrototypingData DictionarySoft ComputingVorlesung/KonferenzComputeranimationBesprechung/Interview
Funktion <Mathematik>VorgehensmodellAutomatische IndexierungAppletIndexberechnungToken-RingFeldrechnerDatenfeldGebäude <Mathematik>AusgleichsrechnungAlgorithmusProgrammbibliothekDefaultHypercubeParametersystemPrädikatenlogik erster StufeDokumentenserverEin-AusgabeProblemorientierte ProgrammierspracheImplementierungInverser LimesIterationMereologieVorgehensmodellEin-AusgabeElektronische PublikationAutomatische IndexierungWort <Informatik>ZweiMultiplikationsoperatorVerschlingungExtreme programmingCodeOpen SourceDatenfeldVersionsverwaltungFunktion <Mathematik>DefaultParametersystemProgrammbibliothekPhysikalische TheorieCase-ModdingMessage-PassingWrapper <Programmierung>KundendatenbankVorlesung/KonferenzComputeranimation
SichtenkonzeptAutomatische IndexierungAppletIndexberechnungVorgehensmodellInformationUmwandlungsenthalpieWellenpaketAutomatische IndexierungVorgehensmodellWort <Informatik>Vorlesung/KonferenzComputeranimation
VorgehensmodellElektronische PublikationIndexberechnungAppletInformationUmwandlungsenthalpieWellenpaketAutomatische IndexierungAbfrageParserVerzeichnisdienstOffene MengePhysikalisches SystemEin-AusgabePrädikatenlogik erster StufeZeichenketteGebäude <Mathematik>MikroprozessorÄhnlichkeitsgeometrieGamecontrollerMikrocomputerNotebook-ComputerHardwareSoftwareGroßrechnerComputerDatenfeldWärmeausdehnungTermGraphSichtenkonzeptVektorrechnerVorgehensmodellCASE <Informatik>MultiplikationsoperatorAbfrageExpandierender GraphAutomatische IndexierungPrädikatenlogik erster StufeÄhnlichkeitsgeometrieVektorrechnerSoft ComputingTUNIS <Programm>Gebäude <Mathematik>GraphHalbleiterspeicherWort <Informatik>SoftwaretestDefaultParametersystemOffene MengeMereologieNotebook-ComputerFaktor <Algebra>SoftwareClientGroßrechnerGenerator <Informatik>Funktionale ProgrammierspracheEin-AusgabeElektronische PublikationMikroprozessorGamecontrollerMikrocomputerHardwareProblemorientierte ProgrammierspracheGruppenoperationDifferenteWärmeausdehnungVerzeichnisdienstMathematikXMLVorlesung/KonferenzComputeranimation
MultiplikationVorgehensmodellWiederherstellung <Informatik>ROM <Informatik>IndexberechnungInformationsspeicherungMathematikGraphOffene MengeMultiplikationsoperatorVorgehensmodellWellenpaketPhysikalisches SystemMomentenproblemComputerarchitekturSpannweite <Stochastik>Automatische IndexierungElastische DeformationElektronische PublikationIntegralInformationsspeicherungHalbleiterspeicherGraphWiederherstellung <Informatik>ZahlenbereichDefaultParametersystemAutomatische HandlungsplanungMereologieMini-DiscDateiformatGrenzschichtablösungCASE <Informatik>InstantiierungDateiverwaltungVirtuelle AdresseInverser LimesProgrammierspracheGeradeMultiplikationVorlesung/KonferenzComputeranimation
Einbettung <Mathematik>MereologieFreewareMomentenproblemVorlesung/Konferenz
Streaming <Kommunikationstechnik>MultiplikationsoperatorAbstimmung <Frequenz>Vorlesung/KonferenzBesprechung/Interview
VektorrechnerStrategisches SpielÄhnlichkeitsgeometrieVorlesung/Konferenz
VorgehensmodellVirtuelle MaschineVorlesung/Konferenz
Wort <Informatik>Arithmetisches MittelKontextbezogenes SystemVektorrechnerAlgorithmusSchnittmengeOrdnung <Mathematik>DifferenteVorlesung/KonferenzBesprechung/Interview
Formation <Mathematik>Vorlesung/KonferenzJSONXMLUML
Transkript: Englisch(automatisch erzeugt)