Enhancing Conversational Search: Large Language Model-Aided Informative Query Rewriting
Points clés générés par l'IA
- La réécriture de requêtes est essentielle pour améliorer la recherche conversationnelle en transformant les requêtes utilisateur dépendantes du contexte en formes autonomes.
- Les approches existantes se basent sur des réécritures humaines comme étiquettes pour entraîner des modèles, mais celles-ci peuvent manquer d'informations suffisantes.
- Utilisation de grands modèles linguistiques (LLMs) pour générer des réécritures informatives grâce à des instructions bien conçues.
- Définition de quatre propriétés essentielles pour les réécritures bien formulées et leur incorporation dans l'instruction.
- Introduction du rôle d'éditeurs de réécriture pour les LLMs afin d'améliorer le processus de réécriture.
- Proposition de distiller les capacités de réécriture des LLMs dans des modèles plus petits pour réduire la latence.
- Expérimentation montrant que les réécritures informatives améliorent significativement la performance par rapport aux réécritures humaines, surtout avec des systèmes récupérateurs épars.
- Traduction en français :
- La rewriting of requests plays an essential role in improving conversational search by transforming context-dependent user queries into standalone forms.
- Existing approaches mainly rely on human rewritten queries as labels to train query rewriting models. However, human rewrites may lack sufficient information for optimal retrieval performance. To overcome this limitation, we propose using large language models (LLMs) as query rewriters, enabling the generation of informative rewrites through well-designed instructions. We define four essential properties for well-formulated rewrites and incorporate them all into the instruction. Additionally, we introduce the role of rewrite editors for LLMs when initial rewrites are available, forming a "rewrite then edit" process. Furthermore, we propose distilling the rewriting capabilities of LLMs into smaller models to reduce rewrite latency. Our experimental evaluation on the QReCC dataset demonstrates that informative rewrites can significantly enhance retrieval performance compared to human rewrites, especially with sparse retrieval systems. A simple approach to improve the informativeness of rewritten queries is to provide human annotators with more comprehensive instructions so they can make not only the original queries unambiguous but also informative. However, this approach has several drawbacks including high cost, increased workload for
Auteurs : Fanghua Ye, Meng Fang, Shenghui Li, Emine Yilmaz
Résumé : Query rewriting plays a vital role in enhancing conversational search by transforming context-dependent user queries into standalone forms. Existing approaches primarily leverage human-rewritten queries as labels to train query rewriting models. However, human rewrites may lack sufficient information for optimal retrieval performance. To overcome this limitation, we propose utilizing large language models (LLMs) as query rewriters, enabling the generation of informative query rewrites through well-designed instructions. We define four essential properties for well-formed rewrites and incorporate all of them into the instruction. In addition, we introduce the role of rewrite editors for LLMs when initial query rewrites are available, forming a ``rewrite-then-edit'' process. Furthermore, we propose distilling the rewriting capabilities of LLMs into smaller models to reduce rewriting latency. Our experimental evaluation on the QReCC dataset demonstrates that informative query rewrites can yield substantially improved retrieval performance compared to human rewrites, especially with sparse retrievers.
Posez des questions sur cet article à notre assistant IA
Vous pouvez aussi discutez avec plusieurs papiers à la fois ici.
Évaluez la qualité du contenu généré par l'IA en votant
Note : 0
Pourquoi avons-nous besoin de votes ?
Les votes sont utilisés pour déterminer si nous devons réexécuter nos outils de synthèse. Si le compte atteint -10, nos outils peuvent être redémarrés.
Articles similaires résumés avec nos outils d'IA
Naviguez à travers encore plus d'articles similaires en utilisant une
représentation arborescenteRecherchez des articles similaires (en version bêta)
En cliquant sur le bouton ci-dessus, notre algorithme analysera tous les articles de notre base de données pour trouver le plus proche en fonction du contenu des articles complets et pas seulement des métadonnées. Veuillez noter que cela ne fonctionne que pour les articles pour lesquels nous avons généré des résumés et que vous pouvez le réexécuter de temps en temps pour obtenir un résultat plus précis pendant que notre base de données s'agrandit.
Avertissement : Notre outil de synthèse basé sur l'IA et l'assistant virtuel fournis sur ce site Web peuvent ne pas toujours fournir des résumés complets ou des réponses exactes. Nous vous encourageons à examiner attentivement et à évaluer le contenu généré pour vous assurer de sa qualité et de sa pertinence par rapport à vos besoins.