Enhancing Conversational Search: Large Language Model-Aided Informative Query Rewriting

Mots clés générés par l'IA : Réécriture de requêtes recherche conversationnelle modèles linguistiques réécritures informatives éditeurs de réécriture

Points clés générés par l'IA

  • La réécriture de requêtes est essentielle pour améliorer la recherche conversationnelle en transformant les requêtes utilisateur dépendantes du contexte en formes autonomes.
  • Les approches existantes se basent sur des réécritures humaines comme étiquettes pour entraîner des modèles, mais celles-ci peuvent manquer d'informations suffisantes.
  • Utilisation de grands modèles linguistiques (LLMs) pour générer des réécritures informatives grâce à des instructions bien conçues.
  • Définition de quatre propriétés essentielles pour les réécritures bien formulées et leur incorporation dans l'instruction.
  • Introduction du rôle d'éditeurs de réécriture pour les LLMs afin d'améliorer le processus de réécriture.
  • Proposition de distiller les capacités de réécriture des LLMs dans des modèles plus petits pour réduire la latence.
  • Expérimentation montrant que les réécritures informatives améliorent significativement la performance par rapport aux réécritures humaines, surtout avec des systèmes récupérateurs épars.
  • Traduction en français :
  • La rewriting of requests plays an essential role in improving conversational search by transforming context-dependent user queries into standalone forms.
  • Existing approaches mainly rely on human rewritten queries as labels to train query rewriting models. However, human rewrites may lack sufficient information for optimal retrieval performance. To overcome this limitation, we propose using large language models (LLMs) as query rewriters, enabling the generation of informative rewrites through well-designed instructions. We define four essential properties for well-formulated rewrites and incorporate them all into the instruction. Additionally, we introduce the role of rewrite editors for LLMs when initial rewrites are available, forming a "rewrite then edit" process. Furthermore, we propose distilling the rewriting capabilities of LLMs into smaller models to reduce rewrite latency. Our experimental evaluation on the QReCC dataset demonstrates that informative rewrites can significantly enhance retrieval performance compared to human rewrites, especially with sparse retrieval systems. A simple approach to improve the informativeness of rewritten queries is to provide human annotators with more comprehensive instructions so they can make not only the original queries unambiguous but also informative. However, this approach has several drawbacks including high cost, increased workload for
Accédez également à nos autres résultats générés par IA : Résumé complet, Résumé vulgarisé, Article de type blog; ou posez des questions sur cet article à notre Assistant IA.

Auteurs : Fanghua Ye, Meng Fang, Shenghui Li, Emine Yilmaz

21 pages, accepted to EMNLP Findings 2023
Licence : CC BY 4.0

Résumé : Query rewriting plays a vital role in enhancing conversational search by transforming context-dependent user queries into standalone forms. Existing approaches primarily leverage human-rewritten queries as labels to train query rewriting models. However, human rewrites may lack sufficient information for optimal retrieval performance. To overcome this limitation, we propose utilizing large language models (LLMs) as query rewriters, enabling the generation of informative query rewrites through well-designed instructions. We define four essential properties for well-formed rewrites and incorporate all of them into the instruction. In addition, we introduce the role of rewrite editors for LLMs when initial query rewrites are available, forming a ``rewrite-then-edit'' process. Furthermore, we propose distilling the rewriting capabilities of LLMs into smaller models to reduce rewriting latency. Our experimental evaluation on the QReCC dataset demonstrates that informative query rewrites can yield substantially improved retrieval performance compared to human rewrites, especially with sparse retrievers.

Soumis à arXiv le 15 Oct. 2023

Posez des questions sur cet article à notre assistant IA

Vous pouvez aussi discutez avec plusieurs papiers à la fois ici.

Instructions pour utiliser l'assistant IA ?

Résultats du processus de synthèse de l'article arXiv : 2310.09716v1

La réécriture de requêtes joue un rôle essentiel dans l'amélioration de la recherche conversationnelle en transformant les requêtes utilisateur dépendantes du contexte en formes autonomes. Les approches existantes s'appuient principalement sur des requêtes réécrites par des humains comme étiquettes pour entraîner des modèles de réécriture de requêtes. Cependant, les réécritures humaines peuvent manquer d'informations suffisantes pour une performance optimale en matière de récupération. Pour surmonter cette limitation, nous proposons d'utiliser de grands modèles linguistiques (LLMs) comme réécrivains de requêtes, permettant la génération de réécritures informatives grâce à des instructions bien conçues. Nous définissons quatre propriétés essentielles pour les réécritures bien formulées et les incorporons toutes dans l'instruction. De plus, nous introduisons le rôle d'éditeurs de réécriture pour les LLMs lorsque des réécritures initiales sont disponibles, formant ainsi un processus "réécrire puis éditer". En outre, nous proposons de distiller les capacités de réécriture des LLMs dans des modèles plus petits pour réduire la latence de réécriture. Notre évaluation expérimentale sur l'ensemble de données QReCC démontre que des réécritures informatives peuvent considérablement améliorer la performance en matière de récupération par rapport aux réécritures humaines, notamment avec des systèmes récupérateurs épars. Une approche simple pour améliorer l'informativité des requêtes réécrites est de fournir aux annotateurs humains des instructions plus complètes afin qu'ils puissent non seulement rendre les requêtes originales non ambiguës mais aussi informatives. Cependant, cette approche présente plusieurs inconvénients, notamment son coût élevé, l'augmentation de la charge de travail pour les annotateurs humains et le risque accru d'incohérences entre les différentes versions annotées. Il est donc nécessaire d'explorer des approches alternatives. Dans cet article, nous proposons l'utilisation de grands modèles linguistiques (LLMs) pour la réécriture de requêtes, exploitant leurs impressionnantes capacités à suivre des instructions et des démonstrations. Nous considérons deux paramètres pour inciter les LLMs en tant que rewriters : dans le cadre d'un apprentissage sans données préalables, seule une instruction est fournie ; tandis que dans le cadre d'un apprentissage avec quelques données préalables, à la fois une instruction et quelques démonstrations sont fournies. Pour élaborer des instructions appropriées, nous identifions tout d'abord quatre propriétés essentielles caractérisant une requête bien formulée après sa relecture. Ensuite, nous concevons une instruction qui intègre ces quatre propriétés. Cependant, générer des relectures possédant toutes ces propriétés peut poser problème aux LLMs en raison du caractère complexe de l'instruction. Ainsi, nous proposons un rôle supplémentaire pour les LLMs en tant qu'éditeurs lorsqu'il s'agit d'une relecture initiale fournie.
Créé le 06 Mai. 2025

Évaluez la qualité du contenu généré par l'IA en votant

Note : 0

Pourquoi avons-nous besoin de votes ?

Les votes sont utilisés pour déterminer si nous devons réexécuter nos outils de synthèse. Si le compte atteint -10, nos outils peuvent être redémarrés.

Articles similaires résumés avec nos outils d'IA

Naviguez à travers encore plus d'articles similaires en utilisant une

représentation arborescente

Recherchez des articles similaires (en version bêta)

En cliquant sur le bouton ci-dessus, notre algorithme analysera tous les articles de notre base de données pour trouver le plus proche en fonction du contenu des articles complets et pas seulement des métadonnées. Veuillez noter que cela ne fonctionne que pour les articles pour lesquels nous avons généré des résumés et que vous pouvez le réexécuter de temps en temps pour obtenir un résultat plus précis pendant que notre base de données s'agrandit.

Avertissement : Notre outil de synthèse basé sur l'IA et l'assistant virtuel fournis sur ce site Web peuvent ne pas toujours fournir des résumés complets ou des réponses exactes. Nous vous encourageons à examiner attentivement et à évaluer le contenu généré pour vous assurer de sa qualité et de sa pertinence par rapport à vos besoins.