Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/22/es: Difference between revisions

    From Marovi AI
    (Importing a new version from external source)
     
    (No difference)

    Latest revision as of 08:27, 19 February 2025

    Information about message (contribute)
    This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
    Message definition (FACTS About Building Retrieval Augmented Generation-based Chatbots)
    Retrieval Augmented Generation (RAG) is a process where relevant information is retrieved from vector databases through semantic matching and then fed to LLMs for response generation. In a RAG pipeline, vector databases and LLMs collaboratively ensure the delivery of up-to-date enterprise knowledge. However, RAG pipelines have many control points, each of which when not tuned well can lead to lower accuracy, hallucinations, and irrelevant responses by Chatbots. Additionally, document access control permissions complicate the search and retrieval process, requiring careful management to ensure data security and relevance. Furthermore, multi-modal content necessitates the use of multi-modal retrievers to handle structured, unstructured, and semi-structured data, including presentations, diagrams, videos, and meeting recordings. Addressing these challenges is critical for maintaining the accuracy and reliability of enterprise chatbots. Inspired by ([[#bib.bib3|3]]), we identify fifteen control points of RAG from our case studies visualized in Figure [[#S2.F1|1]]. Each control point is labeled with a number. In the remainder of this section, we present our insights and learnings for addressing RAG control points.

    La Generación Aumentada por Recuperación (RAG) es un proceso en el que se recupera información relevante de bases de datos vectoriales mediante coincidencias semánticas y luego se alimenta a los LLMs para la generación de respuestas. En una canalización RAG, las bases de datos vectoriales y los LLMs colaboran para asegurar la entrega de conocimiento empresarial actualizado. Sin embargo, las canalizaciones RAG tienen muchos puntos de control, cada uno de los cuales, si no está bien ajustado, puede llevar a una menor precisión, alucinaciones y respuestas irrelevantes por parte de los chatbots. Además, los permisos de control de acceso a documentos complican el proceso de búsqueda y recuperación, requiriendo una gestión cuidadosa para asegurar la seguridad y relevancia de los datos. Además, el contenido multimodal requiere el uso de recuperadores multimodales para manejar datos estructurados, no estructurados y semiestructurados, incluyendo presentaciones, diagramas, videos y grabaciones de reuniones. Abordar estos desafíos es crítico para mantener la precisión y fiabilidad de los chatbots empresariales. Inspirados por (3), identificamos quince puntos de control de RAG a partir de nuestros estudios de caso visualizados en la Figura 1. Cada punto de control está etiquetado con un número. En el resto de esta sección, presentamos nuestras ideas y aprendizajes para abordar los puntos de control de RAG.