We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

“Alignment is All You Need”: Analyzing Cross-Lingual Document Similarity for Domain-Specific Applications

Formale Metadaten

Titel
“Alignment is All You Need”: Analyzing Cross-Lingual Document Similarity for Domain-Specific Applications
Serientitel
Anzahl der Teile
7
Autor
Lizenz
CC-Namensnennung - keine kommerzielle Nutzung - keine Bearbeitung 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt in unveränderter Form zu jedem legalen und nicht-kommerziellen Zweck nutzen, vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache
Produktionsjahr2021

Inhaltliche Metadaten

Fachgebiet
Genre
Abstract
Cross-lingual text similarity provides an important measure to adjudge the contextual and semantic similarity between documents across different languages. Extraction of similar or aligned multilingual texts would enable efficient approaches for information retrieval and natural language processing applications. However, diversity of linguistic constructs coupled with domain specificity and low resources pose a significant challenge. In this paper, we present a study analyzing the performance of different existing approaches, and show that Word Mover’s Distance on aligned language embedding provides a reliable and cost-effective cross-lingual text similarity measure to tackle evolving domain information, even when compared to advanced machine learning models.
Schlagwörter