Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/22/fr: Difference between revisions

    From Marovi AI
    (Importing a new version from external source)
     
    (No difference)

    Latest revision as of 07:25, 20 February 2025

    Information about message (contribute)
    This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
    Message definition (FACTS About Building Retrieval Augmented Generation-based Chatbots)
    Retrieval Augmented Generation (RAG) is a process where relevant information is retrieved from vector databases through semantic matching and then fed to LLMs for response generation. In a RAG pipeline, vector databases and LLMs collaboratively ensure the delivery of up-to-date enterprise knowledge. However, RAG pipelines have many control points, each of which when not tuned well can lead to lower accuracy, hallucinations, and irrelevant responses by Chatbots. Additionally, document access control permissions complicate the search and retrieval process, requiring careful management to ensure data security and relevance. Furthermore, multi-modal content necessitates the use of multi-modal retrievers to handle structured, unstructured, and semi-structured data, including presentations, diagrams, videos, and meeting recordings. Addressing these challenges is critical for maintaining the accuracy and reliability of enterprise chatbots. Inspired by ([[#bib.bib3|3]]), we identify fifteen control points of RAG from our case studies visualized in Figure [[#S2.F1|1]]. Each control point is labeled with a number. In the remainder of this section, we present our insights and learnings for addressing RAG control points.

    La génération augmentée par récupération (RAG) est un processus où des informations pertinentes sont extraites de bases de données vectorielles par correspondance sémantique, puis transmises aux LLM pour la génération de réponses. Dans un pipeline RAG, les bases de données vectorielles et les LLM collaborent pour garantir la livraison de connaissances d'entreprise à jour. Cependant, les pipelines RAG comportent de nombreux points de contrôle, chacun d'eux pouvant, s'il n'est pas bien ajusté, entraîner une baisse de précision, des hallucinations et des réponses non pertinentes par les chatbots. De plus, les autorisations de contrôle d'accès aux documents compliquent le processus de recherche et de récupération, nécessitant une gestion minutieuse pour assurer la sécurité et la pertinence des données. En outre, le contenu multimodal nécessite l'utilisation de récupérateurs multimodaux pour gérer les données structurées, non structurées et semi-structurées, y compris les présentations, les diagrammes, les vidéos et les enregistrements de réunions. Relever ces défis est crucial pour maintenir la précision et la fiabilité des chatbots d'entreprise. Inspirés par (3), nous identifions quinze points de contrôle de RAG à partir de nos études de cas visualisées dans la Figure 1. Chaque point de contrôle est étiqueté avec un numéro. Dans la suite de cette section, nous présentons nos idées et nos apprentissages pour aborder les points de contrôle RAG.