Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/22/de: Difference between revisions

    From Marovi AI
    (Importing a new version from external source)
     
    (No difference)

    Latest revision as of 07:23, 20 February 2025

    Information about message (contribute)
    This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
    Message definition (FACTS About Building Retrieval Augmented Generation-based Chatbots)
    Retrieval Augmented Generation (RAG) is a process where relevant information is retrieved from vector databases through semantic matching and then fed to LLMs for response generation. In a RAG pipeline, vector databases and LLMs collaboratively ensure the delivery of up-to-date enterprise knowledge. However, RAG pipelines have many control points, each of which when not tuned well can lead to lower accuracy, hallucinations, and irrelevant responses by Chatbots. Additionally, document access control permissions complicate the search and retrieval process, requiring careful management to ensure data security and relevance. Furthermore, multi-modal content necessitates the use of multi-modal retrievers to handle structured, unstructured, and semi-structured data, including presentations, diagrams, videos, and meeting recordings. Addressing these challenges is critical for maintaining the accuracy and reliability of enterprise chatbots. Inspired by ([[#bib.bib3|3]]), we identify fifteen control points of RAG from our case studies visualized in Figure [[#S2.F1|1]]. Each control point is labeled with a number. In the remainder of this section, we present our insights and learnings for addressing RAG control points.

    Retrieval Augmented Generation (RAG) ist ein Prozess, bei dem relevante Informationen durch semantisches Matching aus Vektordatenbanken abgerufen und dann an LLMs zur Antwortgenerierung weitergeleitet werden. In einer RAG-Pipeline arbeiten Vektordatenbanken und LLMs zusammen, um die Bereitstellung aktueller Unternehmenskenntnisse sicherzustellen. Allerdings haben RAG-Pipelines viele Kontrollpunkte, von denen jeder, wenn er nicht gut abgestimmt ist, zu geringerer Genauigkeit, Halluzinationen und irrelevanten Antworten von Chatbots führen kann. Darüber hinaus erschweren Zugriffsberechtigungen für Dokumente den Such- und Abrufprozess, was eine sorgfältige Verwaltung erfordert, um Datensicherheit und Relevanz zu gewährleisten. Außerdem erfordert multimodaler Inhalt den Einsatz multimodaler Retriever, um strukturierte, unstrukturierte und halbstrukturierte Daten, einschließlich Präsentationen, Diagrammen, Videos und Besprechungsaufzeichnungen, zu verarbeiten. Die Bewältigung dieser Herausforderungen ist entscheidend für die Aufrechterhaltung der Genauigkeit und Zuverlässigkeit von Unternehmens-Chatbots. Inspiriert von (3) identifizieren wir fünfzehn Kontrollpunkte von RAG aus unseren Fallstudien, die in Abbildung 1 visualisiert sind. Jeder Kontrollpunkt ist mit einer Nummer gekennzeichnet. Im weiteren Verlauf dieses Abschnitts präsentieren wir unsere Erkenntnisse und Erfahrungen zur Bewältigung der RAG-Kontrollpunkte.